🔌 Instalacao e configuracao
O oh-my-openagent (OMO) e um plugin que transforma o OpenCode (editor de codigo com IA) em um sistema multiagente completo. Com mais de 41 mil stars no GitHub, e uma das formas mais acessiveis de experimentar swarms sem precisar escrever uma linha de codigo de orquestracao. A instalacao e feita via bunx opencode — o Bun (runtime JavaScript) e a unica dependencia.
A configuracao envolve dois arquivos: opencode.json (na raiz do projeto) define qual provider e modelo usar como padrao, e .opencode/oh-my-opencode.jsonc permite customizar qual modelo cada agente do swarm utiliza. Voce pode misturar providers — Anthropic para o orquestrador, OpenAI para o coder, modelos gratuitos para exploracao — otimizando custo e performance por papel.
💡 Setup completo
Os passos para comecar a usar o OMO:
-
•
Instalar Bun: Runtime JavaScript necessario —
curl -fsSL https://bun.sh/install | bash -
•
Instalar OpenCode:
bunx opencodeinicia o editor com OMO integrado - • Configurar provider: Adicionar API key do Anthropic, OpenAI ou Google no arquivo de config
- • Customizar por agente: oh-my-opencode.jsonc permite definir modelo especifico para cada agente
📊 Requisitos e compatibilidade
- Bun 1.0+: Runtime principal — mais rapido que Node.js para este caso de uso
- Providers suportados: Anthropic, OpenAI, Google, Azure, Ollama, modelos gratuitos via OpenCode Zen
- Plataformas: Linux, macOS, Windows (via WSL) — qualquer terminal moderno
- Projeto qualquer: Funciona em qualquer diretorio de projeto — nao requer framework especifico
⚡ Modo ultrawork: velocidade maxima
O modo ultrawork e o modo de execucao mais agressivo do OMO. Voce simplesmente escreve ultrawork seguido da descricao da tarefa, e o swarm inteiro e ativado: o orquestrador Sisyphus analisa a tarefa, classifica o tipo de trabalho, aciona os agentes relevantes e executa ate completar — tudo sem intervencao humana. E o equivalente a dizer "faca tudo e me avise quando terminar".
No modo ultrawork, todos os agentes operam em paralelo quando possivel. O Sisyphus coordena, o Hephaestus escreve codigo, o Explorer escaneia o codebase para fornecer contexto, o Librarian busca documentacao e o Multimodal Looker analisa screenshots se necessario. O resultado e velocidade maxima para tarefas onde voce tem clareza total do que quer — landing pages, refatoracoes, implementacoes de features com spec clara.
💡 Como ultrawork funciona
O fluxo interno do modo ultrawork:
- • Classificacao automatica: Sisyphus analisa a tarefa e determina a categoria (Visual, Research, Quick, UltraBrain)
- • Ativacao de agentes: Todos os agentes relevantes sao ativados em paralelo
- • Execucao continua: Sem pausas para confirmacao — executa ate concluir ou atingir limite
- • Auto-correcao: Se algo falha, o swarm tenta corrigir automaticamente antes de reportar erro
📊 Quando usar ultrawork
- Ideal para: Tarefas com spec clara, refatoracoes, implementacoes padrao, landing pages
- Evitar quando: Projetos novos sem definicao clara — use Prometheus para explorar primeiro
- Tempo tipico: Uma landing page completa em 5-15 minutos vs horas manualmente
- Custo tipico: US$ 0.50-2.00 por tarefa dependendo da complexidade e modelos usados
📋 Modo Prometheus: entrevista + plano
O modo Prometheus e o oposto do ultrawork: em vez de executar imediatamente, o agente Prometheus inicia uma entrevista detalhada para entender completamente o que voce precisa antes de comecar. Ele faz perguntas sobre escopo, restricoes, tecnologias preferidas, publico-alvo e criterios de sucesso. Somente depois de construir um plano completo e obter sua aprovacao e que o Sisyphus comeca a executar.
Para ativar o Prometheus, basta pressionar Tab no OpenCode. O agente planificador assume e comeca o questionario. Depois de 5-10 perguntas (geralmente), ele apresenta um plano estruturado com etapas, agentes responsaveis e estimativa de tempo. Voce revisa, ajusta se necessario e digita /start-work para iniciar a execucao. Essa abordagem e ideal para projetos novos, tarefas ambiguas ou quando voce ainda esta explorando possibilidades.
💡 Fluxo do Prometheus
As etapas da entrevista e planejamento:
- • Ativacao: Pressione Tab para alternar para Prometheus no OpenCode
- • Entrevista: O agente faz perguntas sobre escopo, requisitos, restricoes e preferencias
- • Plano: Prometheus gera um plano detalhado com etapas, agentes e estimativas
- • Execucao: Apos aprovacao, /start-work inicia o swarm com o plano como guia
📊 Melhores cenarios para Prometheus
- Projeto novo: Quando voce ainda nao tem clareza total do que precisa
- Tarefa ambigua: 'Melhorar a performance do app' — Prometheus descobre onde e como
- Stakeholder externo: Quando voce esta traduzindo requisitos de um cliente para tarefas tecnicas
- Exploracao: Quando quer entender as opcoes antes de decidir a abordagem
🎯 Categorias de roteamento do Sisyphus
O Sisyphus e o orquestrador do OMO — o agente central que analisa cada tarefa e decide qual combinacao de agentes e abordagem usar. Ele categoriza automaticamente as tarefas em quatro categorias: Visual Engineering (interfaces, CSS, layouts), Deep Research (analise profunda, investigacao de bugs complexos), Quick Changes (ajustes rapidos, fixes pontuais) e UltraBrain (tarefas que exigem raciocinio complexo e planejamento).
Cada categoria aciona uma combinacao diferente de agentes e modelos otimizados. Visual Engineering ativa o agente de design com modelo especializado em CSS/HTML. Deep Research ativa o Explorer com modelo de raciocinio forte. Quick Changes usa modelo rapido e barato para mudancas triviais. UltraBrain ativa todos os agentes com o modelo mais potente disponivel. Esse roteamento automatico e o que torna o OMO eficiente — voce nao precisa decidir qual agente usar.
💡 As quatro categorias
Como o Sisyphus classifica e roteia tarefas:
- • Visual Engineering: Interfaces, CSS, animacoes, layouts — prioriza agentes visuais
- • Deep Research: Investigacao de bugs, analise de codebase, decisoes arquiteturais — prioriza Explorer e Librarian
- • Quick Changes: Fixes rapidos, typos, ajustes menores — modelo leve e rapido
- • UltraBrain: Tarefas complexas que exigem raciocinio profundo — todos agentes, modelo potente
📊 Otimizacao por categoria
- Visual → modelo especializado: GPT-4o ou Claude com foco em geracao de UI
- Research → raciocinio forte: Claude Opus ou GPT-5 para analise profunda
- Quick → rapido e barato: GPT-4o-mini ou Haiku para mudancas triviais
- UltraBrain → sem limites: Modelo mais potente + todos os agentes em paralelo
⚙️ Configurando modelos por agente
Uma das features mais poderosas do OMO e a capacidade de configurar qual modelo cada agente utiliza individualmente. O arquivo .opencode/oh-my-opencode.jsonc permite definir que o Sisyphus (orquestrador) use Claude Opus para raciocinio complexo, o Hephaestus (coder) use Codex para geracao de codigo, o Explorer use um modelo gratuito para leitura de arquivos e o Prometheus use Claude Sonnet para planejamento.
Essa configuracao granular permite otimizar drasticamente o custo sem sacrificar qualidade. O orquestrador precisa de raciocinio forte (modelo caro), mas o explorer so precisa ler e resumir arquivos (modelo barato). O coder precisa de geracao de codigo precisa (modelo especializado), mas o librarian so precisa buscar documentacao (modelo gratuito). Na pratica, essa estrategia pode reduzir custos em 60-80% comparado a usar o modelo mais potente para todos os agentes.
💡 Mapa de modelos
Configuracao recomendada por agente:
- • Sisyphus (orquestrador): Claude Opus ou GPT-5 — precisa de raciocinio forte para delegacao
- • Hephaestus (coder): Codex 5.3 ou Claude Sonnet — otimizado para geracao de codigo
- • Explorer (leitor): Modelo gratuito (Big Pickle, minimax) — so precisa ler e resumir
- • Prometheus (planejador): Claude Sonnet — bom equilibrio entre raciocinio e custo
📊 Impacto no custo
- Todos Opus: ~US$ 5-10 por tarefa complexa — custo alto mas qualidade maxima
- Mix otimizado: ~US$ 0.50-2.00 por tarefa — reducao de 60-80% no custo
- Modelos gratuitos: Explorer e Librarian gratuitos via OpenCode Zen — custo zero para leitura
- ROI: Qualidade final similar porque cada agente recebe o modelo ideal para seu papel
🏗️ Projeto completo: landing page do zero
Para demonstrar o OMO em acao, vamos acompanhar a criacao de uma landing page completa do zero usando o modo Prometheus. O fluxo comeca com a entrevista: Prometheus pergunta sobre o produto, publico-alvo, tom de voz, cores, secoes desejadas e referencias visuais. Com base nas respostas, ele gera um plano detalhado com 5-8 etapas.
Apos aprovacao do plano com /start-work, o Sisyphus assume e executa em paralelo: Explorer mapeia a estrutura do projeto, Hephaestus implementa HTML/CSS/JS, Multimodal Looker analisa screenshots para verificar fidelidade visual, e o ciclo de revisao automatica corrige problemas. Em 10-15 minutos, voce tem uma landing page responsiva, com animacoes, SEO basico e pronta para deploy. Todo o processo e transparente — voce ve cada agente trabalhando em tempo real.
💡 Fluxo do projeto
As etapas de ponta a ponta:
- • Entrevista Prometheus: 5-10 perguntas sobre produto, design, funcionalidades e restricoes
- • Plano aprovado: Estrutura detalhada com HTML, CSS, JS, imagens e animacoes
- • Execucao paralela: Multiplos agentes trabalhando simultaneamente em arquivos diferentes
- • Revisao automatica: Auto-correcao de bugs visuais e funcionais antes de entregar
📊 Resultados tipicos
- Tempo: 10-15 minutos para landing page completa (vs 4-8 horas manualmente)
- Qualidade: Responsivo, com animacoes, SEO basico, acessibilidade — pronto para deploy
- Custo: US$ 1-3 com mix de modelos otimizado
- Iteracao: Ajustes subsequentes em 1-3 minutos — 'mude a cor do botao para azul' e pronto
📚 Resumo do Modulo
Proximo:
Modulo 2.5 - AutoGen