TCC - Visão Geral

Aluno: Eduardo Cruz Guedes · educg550@usp.br NUSP: 13672752 Curso: Bacharelado em Ciência da Computação - 5º ano - IME-USP

Orientadores:

Prof. Paulo Meirelles (paulormm@ime.usp.br) - IME-USP
Prof. Jorge Melegati (jorge@jmelegati.com) - Universidade do Porto

Tema

Avaliação de um Pipeline Multiagente Baseado em TDD com Validação Comportamental via Computer Using Agents

Pergunta de Pesquisa

O pipeline de geração de código baseado em TDD com validação final via CUA produz código mais correto do que a geração direta de código a partir de requisitos com LLM?

Hipótese

O pipeline que gera testes automaticamente e implementa código que passe nessas TDDs, com validação final via CUA, produz código de maior qualidade do que a abordagem de geração direta, na qual o LLM recebe o requisito e implementa sem nenhuma estrutura adicional de testes e sem validação comportamental.

Resumo

O TCC compara dois pipelines de geração de código com LLM:

Pipeline	Descrição
Baseline	LLM recebe requisito → implementa diretamente (sem TDD, sem validação extra)
Experimental	Agente A gera testes → Agente B implementa → CI → CUA valida comportamento

O Computer Using Agent (CUA) participa da etapa final do pipeline experimental: simula um usuário real interagindo com o sistema gerado e verifica se o comportamento observado corresponde ao requisito original - independentemente do que os testes unitários cobrem.

Estrutura do Site

Proposta de Pesquisa - detalhamento da proposta, pipelines e configuração experimental
Metodologia - métricas, escopo, grupos experimentais
Referências - benchmarks, ferramentas e leituras
Diário de Pesquisa - notas e progressos ao longo do ano

Tema​

Pergunta de Pesquisa​

Hipótese​

Resumo​

Estrutura do Site​

Tema

Pergunta de Pesquisa

Hipótese

Resumo

Estrutura do Site