Modulo 2.4: oh-my-openagent na pratica | Enxames de Agentes de IA

1

🔌 Instalacao e configuracao

O oh-my-openagent (OMO) e um plugin que transforma o OpenCode (editor de codigo com IA) em um sistema multiagente completo. Com mais de 41 mil stars no GitHub, e uma das formas mais acessiveis de experimentar swarms sem precisar escrever uma linha de codigo de orquestracao. A instalacao e feita via bunx opencode — o Bun (runtime JavaScript) e a unica dependencia.

A configuracao envolve dois arquivos: opencode.json (na raiz do projeto) define qual provider e modelo usar como padrao, e .opencode/oh-my-opencode.jsonc permite customizar qual modelo cada agente do swarm utiliza. Voce pode misturar providers — Anthropic para o orquestrador, OpenAI para o coder, modelos gratuitos para exploracao — otimizando custo e performance por papel.

💡 Setup completo

Os passos para comecar a usar o OMO:

• Instalar Bun: Runtime JavaScript necessario — curl -fsSL https://bun.sh/install | bash
• Instalar OpenCode: bunx opencode inicia o editor com OMO integrado
• Configurar provider: Adicionar API key do Anthropic, OpenAI ou Google no arquivo de config
• Customizar por agente: oh-my-opencode.jsonc permite definir modelo especifico para cada agente

📊 Requisitos e compatibilidade

Bun 1.0+: Runtime principal — mais rapido que Node.js para este caso de uso
Providers suportados: Anthropic, OpenAI, Google, Azure, Ollama, modelos gratuitos via OpenCode Zen
Plataformas: Linux, macOS, Windows (via WSL) — qualquer terminal moderno
Projeto qualquer: Funciona em qualquer diretorio de projeto — nao requer framework especifico

2

⚡ Modo ultrawork: velocidade maxima

O modo ultrawork e o modo de execucao mais agressivo do OMO. Voce simplesmente escreve ultrawork seguido da descricao da tarefa, e o swarm inteiro e ativado: o orquestrador Sisyphus analisa a tarefa, classifica o tipo de trabalho, aciona os agentes relevantes e executa ate completar — tudo sem intervencao humana. E o equivalente a dizer "faca tudo e me avise quando terminar".

No modo ultrawork, todos os agentes operam em paralelo quando possivel. O Sisyphus coordena, o Hephaestus escreve codigo, o Explorer escaneia o codebase para fornecer contexto, o Librarian busca documentacao e o Multimodal Looker analisa screenshots se necessario. O resultado e velocidade maxima para tarefas onde voce tem clareza total do que quer — landing pages, refatoracoes, implementacoes de features com spec clara.

💡 Como ultrawork funciona

O fluxo interno do modo ultrawork:

• Classificacao automatica: Sisyphus analisa a tarefa e determina a categoria (Visual, Research, Quick, UltraBrain)
• Ativacao de agentes: Todos os agentes relevantes sao ativados em paralelo
• Execucao continua: Sem pausas para confirmacao — executa ate concluir ou atingir limite
• Auto-correcao: Se algo falha, o swarm tenta corrigir automaticamente antes de reportar erro

📊 Quando usar ultrawork

Ideal para: Tarefas com spec clara, refatoracoes, implementacoes padrao, landing pages
Evitar quando: Projetos novos sem definicao clara — use Prometheus para explorar primeiro
Tempo tipico: Uma landing page completa em 5-15 minutos vs horas manualmente
Custo tipico: US$ 0.50-2.00 por tarefa dependendo da complexidade e modelos usados

3

📋 Modo Prometheus: entrevista + plano

O modo Prometheus e o oposto do ultrawork: em vez de executar imediatamente, o agente Prometheus inicia uma entrevista detalhada para entender completamente o que voce precisa antes de comecar. Ele faz perguntas sobre escopo, restricoes, tecnologias preferidas, publico-alvo e criterios de sucesso. Somente depois de construir um plano completo e obter sua aprovacao e que o Sisyphus comeca a executar.

Para ativar o Prometheus, basta pressionar Tab no OpenCode. O agente planificador assume e comeca o questionario. Depois de 5-10 perguntas (geralmente), ele apresenta um plano estruturado com etapas, agentes responsaveis e estimativa de tempo. Voce revisa, ajusta se necessario e digita /start-work para iniciar a execucao. Essa abordagem e ideal para projetos novos, tarefas ambiguas ou quando voce ainda esta explorando possibilidades.

💡 Fluxo do Prometheus

As etapas da entrevista e planejamento:

• Ativacao: Pressione Tab para alternar para Prometheus no OpenCode
• Entrevista: O agente faz perguntas sobre escopo, requisitos, restricoes e preferencias
• Plano: Prometheus gera um plano detalhado com etapas, agentes e estimativas
• Execucao: Apos aprovacao, /start-work inicia o swarm com o plano como guia

📊 Melhores cenarios para Prometheus

Projeto novo: Quando voce ainda nao tem clareza total do que precisa
Tarefa ambigua: 'Melhorar a performance do app' — Prometheus descobre onde e como
Stakeholder externo: Quando voce esta traduzindo requisitos de um cliente para tarefas tecnicas
Exploracao: Quando quer entender as opcoes antes de decidir a abordagem

4

🎯 Categorias de roteamento do Sisyphus

O Sisyphus e o orquestrador do OMO — o agente central que analisa cada tarefa e decide qual combinacao de agentes e abordagem usar. Ele categoriza automaticamente as tarefas em quatro categorias: Visual Engineering (interfaces, CSS, layouts), Deep Research (analise profunda, investigacao de bugs complexos), Quick Changes (ajustes rapidos, fixes pontuais) e UltraBrain (tarefas que exigem raciocinio complexo e planejamento).

Cada categoria aciona uma combinacao diferente de agentes e modelos otimizados. Visual Engineering ativa o agente de design com modelo especializado em CSS/HTML. Deep Research ativa o Explorer com modelo de raciocinio forte. Quick Changes usa modelo rapido e barato para mudancas triviais. UltraBrain ativa todos os agentes com o modelo mais potente disponivel. Esse roteamento automatico e o que torna o OMO eficiente — voce nao precisa decidir qual agente usar.

💡 As quatro categorias

Como o Sisyphus classifica e roteia tarefas:

• Visual Engineering: Interfaces, CSS, animacoes, layouts — prioriza agentes visuais
• Deep Research: Investigacao de bugs, analise de codebase, decisoes arquiteturais — prioriza Explorer e Librarian
• Quick Changes: Fixes rapidos, typos, ajustes menores — modelo leve e rapido
• UltraBrain: Tarefas complexas que exigem raciocinio profundo — todos agentes, modelo potente

📊 Otimizacao por categoria

Visual → modelo especializado: GPT-4o ou Claude com foco em geracao de UI
Research → raciocinio forte: Claude Opus ou GPT-5 para analise profunda
Quick → rapido e barato: GPT-4o-mini ou Haiku para mudancas triviais
UltraBrain → sem limites: Modelo mais potente + todos os agentes em paralelo

5

⚙️ Configurando modelos por agente

Uma das features mais poderosas do OMO e a capacidade de configurar qual modelo cada agente utiliza individualmente. O arquivo .opencode/oh-my-opencode.jsonc permite definir que o Sisyphus (orquestrador) use Claude Opus para raciocinio complexo, o Hephaestus (coder) use Codex para geracao de codigo, o Explorer use um modelo gratuito para leitura de arquivos e o Prometheus use Claude Sonnet para planejamento.

Essa configuracao granular permite otimizar drasticamente o custo sem sacrificar qualidade. O orquestrador precisa de raciocinio forte (modelo caro), mas o explorer so precisa ler e resumir arquivos (modelo barato). O coder precisa de geracao de codigo precisa (modelo especializado), mas o librarian so precisa buscar documentacao (modelo gratuito). Na pratica, essa estrategia pode reduzir custos em 60-80% comparado a usar o modelo mais potente para todos os agentes.

💡 Mapa de modelos

Configuracao recomendada por agente:

• Sisyphus (orquestrador): Claude Opus ou GPT-5 — precisa de raciocinio forte para delegacao
• Hephaestus (coder): Codex 5.3 ou Claude Sonnet — otimizado para geracao de codigo
• Explorer (leitor): Modelo gratuito (Big Pickle, minimax) — so precisa ler e resumir
• Prometheus (planejador): Claude Sonnet — bom equilibrio entre raciocinio e custo

📊 Impacto no custo

Todos Opus: ~US$ 5-10 por tarefa complexa — custo alto mas qualidade maxima
Mix otimizado: ~US$ 0.50-2.00 por tarefa — reducao de 60-80% no custo
Modelos gratuitos: Explorer e Librarian gratuitos via OpenCode Zen — custo zero para leitura
ROI: Qualidade final similar porque cada agente recebe o modelo ideal para seu papel

6

🏗️ Projeto completo: landing page do zero

Para demonstrar o OMO em acao, vamos acompanhar a criacao de uma landing page completa do zero usando o modo Prometheus. O fluxo comeca com a entrevista: Prometheus pergunta sobre o produto, publico-alvo, tom de voz, cores, secoes desejadas e referencias visuais. Com base nas respostas, ele gera um plano detalhado com 5-8 etapas.

Apos aprovacao do plano com /start-work, o Sisyphus assume e executa em paralelo: Explorer mapeia a estrutura do projeto, Hephaestus implementa HTML/CSS/JS, Multimodal Looker analisa screenshots para verificar fidelidade visual, e o ciclo de revisao automatica corrige problemas. Em 10-15 minutos, voce tem uma landing page responsiva, com animacoes, SEO basico e pronta para deploy. Todo o processo e transparente — voce ve cada agente trabalhando em tempo real.

💡 Fluxo do projeto

As etapas de ponta a ponta:

• Entrevista Prometheus: 5-10 perguntas sobre produto, design, funcionalidades e restricoes
• Plano aprovado: Estrutura detalhada com HTML, CSS, JS, imagens e animacoes
• Execucao paralela: Multiplos agentes trabalhando simultaneamente em arquivos diferentes
• Revisao automatica: Auto-correcao de bugs visuais e funcionais antes de entregar

📊 Resultados tipicos

Tempo: 10-15 minutos para landing page completa (vs 4-8 horas manualmente)
Qualidade: Responsivo, com animacoes, SEO basico, acessibilidade — pronto para deploy
Custo: US$ 1-3 com mix de modelos otimizado
Iteracao: Ajustes subsequentes em 1-3 minutos — 'mude a cor do botao para azul' e pronto

🔌 oh-my-openagent na pratica