Pular para o conteúdo principal

TCC — Visão Geral

Aluno: Eduardo Cruz Guedes · educg550@usp.br NUSP: 13672752 Curso: Bacharelado em Ciência da Computação — 5º ano — IME-USP

Orientadores:


Tema

Avaliação de um Pipeline Multiagente Baseado em TDD com Validação Comportamental via Computer Using Agents

Pergunta de Pesquisa

O pipeline de geração de código baseado em TDD com validação final via CUA produz código mais correto do que a geração direta de código a partir de requisitos com LLM?

Hipótese

O pipeline que gera testes automaticamente e implementa código que passe nessas TDDs, com validação final via CUA, produz código de maior qualidade do que a abordagem de geração direta, na qual o LLM recebe o requisito e implementa sem nenhuma estrutura adicional de testes e sem validação comportamental.

Resumo

O TCC compara dois pipelines de geração de código com LLM:

PipelineDescrição
BaselineLLM recebe requisito → implementa diretamente (sem TDD, sem validação extra)
ExperimentalAgente A gera testes → Agente B implementa → CI → CUA valida comportamento

O Computer Using Agent (CUA) participa da etapa final do pipeline experimental: simula um usuário real interagindo com o sistema gerado e verifica se o comportamento observado corresponde ao requisito original — independentemente do que os testes unitários cobrem.

Estrutura do Site