Referências e Links
Test-Oriented Programming (TOP)
Paper do orientador Prof. Jorge Melegati.
Test-Oriented Programming: rethinking coding for the GenAI era Jorge Melegati — Faculty of Engineering, University of Porto DOI: 10.5281/17227298
Resumo: Propõe TOP como novo paradigma onde desenvolvedores apenas verificam código de testes, delegando a geração de código de produção para LLMs. Prova de conceito: ferramenta Onion, testada com GPT-4o-mini e Gemini 2.5-Flash.
Orquestração de Agentes
Pipelines Open Source com Skills
- Superpowers (obra)
- Everything Claude Code (affaan-m)
- Claude Octopus (nyldn) — plugin de orquestração multi-LLM para Claude Code com 8 provedores (Codex, Gemini, Perplexity, Ollama etc.), 47 comandos, 50 skills e 32 personas especializadas; metodologia Double Diamond com gates de consenso (75%)
CLAUDE.md como Backlog de Orquestrador
TDD
Computer Using Agents (CUAs)
Abordagens de CUA
| Abordagem | Descrição |
|---|---|
| Imagética | Tira print da tela, interpreta visualmente e continua o loop |
| DOM + Playwright | Inspeciona o DOM e cria código Playwright em tempo real |
| Textual | Usa ferramentas para ações predeterminadas no ambiente (print, clique, digitação) |
Benchmarks Públicos
| Benchmark | Melhor resultado | Observações |
|---|---|---|
| OS World | ~60% | Ambiente de desktop |
| REAL | ~41% | Ambiente web real |
| Online Mind2Web | ~42% | Navegação web |
| AndroidWorld | Alto, mas controlado | Ambiente mobile |