Pular para o conteúdo principal

Avaliação de um Pipeline Multiagente Baseado em TDD com Validação Comportamental via CUAs

O pipeline de geração de código baseado em TDD produz código mais correto do que a geração direta de código a partir de requisitos?

Eduardo Cruz Guedes · NUSP 13672752 · BCC IME-USP · 5º ano
Orientadores: Prof. Paulo Meirelles · Prof. Jorge Melegati

Proposta de Pesquisa

Baseline: pipeline TDD+LLM (paradigma TOP / Onion). Experimental: mesmo pipeline com CUA como avaliador comportamental final.

Metodologia

Métricas estruturais (CI, ciclomática, mutação) e comportamentais (CUA). Escopo: sistema com frontend, 10–20 requisitos fechados.

Referências

Paper TOP (ICSE 2026), ferramenta Onion, benchmarks de CUAs, TDD com Uncle Bob e pipelines open source de orquestração.