Modulo 2.5: AutoGen e Microsoft Agent Framework

💬 AutoGen: agentes conversacionais

O AutoGen da Microsoft adota uma abordagem radicalmente diferente de CrewAI e LangGraph: em vez de definir grafos ou equipes, voce cria agentes que conversam entre si. A coordenacao emerge do dialogo — um agente propoe, outro critica, um terceiro sintetiza, e o ciclo continua ate chegar a um consenso. E como uma reuniao de brainstorming estruturada entre especialistas.

O componente central e o ConversableAgent: um agente que pode enviar e receber mensagens, chamar ferramentas e interagir com humanos. Dois ConversableAgents conectados ja formam um sistema multiagente funcional. O AssistantAgent (pré-configurado para LLM) e o UserProxyAgent (que executa codigo e representa o humano) sao os tipos mais usados. Essa simplicidade conceitual esconde poder: debates entre agentes frequentemente produzem resultados superiores a um unico agente trabalhando sozinho.

💡 Filosofia conversacional

Como dialogo estruturado cria coordenacao:

• ConversableAgent: Unidade basica — qualquer agente que pode enviar e receber mensagens
• AssistantAgent: Configurado para usar LLM — raciocina e gera texto/codigo
• UserProxyAgent: Representa o humano — pode executar codigo e aprovar acoes
• Dialogo como coordenacao: Agentes se coordenam trocando mensagens — sem orquestrador explicito

📊 Contexto do ecossistema

Microsoft Research: Nasceu como projeto de pesquisa — rigor academico na base
Open source: 40k+ stars no GitHub — comunidade ativa e crescente
Papers academicos: Varios papers publicados validando a abordagem conversacional
Enterprise-ready: Integracao nativa com Azure, Microsoft 365, Semantic Kernel

🔄 Evolucao: Microsoft Agent Framework

Em 2025, a Microsoft lancou o Microsoft Agent Framework, unificando AutoGen e Semantic Kernel em uma plataforma enterprise coesa. O AutoGen continua sendo o motor de conversacao multiagente, enquanto o Semantic Kernel fornece a camada de integracao enterprise (conectores Azure, Microsoft Graph, SharePoint, Teams). Juntos, eles formam a resposta da Microsoft para o ecossistema agentico.

O Agent Framework adiciona recursos que o AutoGen original nao tinha: state management robusto com persistencia, type safety com modelos Pydantic, middleware para logging, caching e rate limiting, e telemetria integrada com Azure Monitor. Para organizacoes ja no ecossistema Microsoft, essa evolucao e natural — tudo se integra com a infraestrutura existente.

💡 O que muda

Melhorias do Agent Framework sobre o AutoGen original:

• State management: Persistencia robusta de estado entre sessoes — nao mais stateless
• Type safety: Modelos Pydantic para estado e mensagens — menos bugs em runtime
• Middleware: Camadas de logging, caching, auth e rate limiting configuráveis
• Telemetria: Integracao nativa com Azure Monitor para observabilidade enterprise

📊 Ecossistema Microsoft

Semantic Kernel: Conectores para Azure, M365, SharePoint, Teams, Dynamics 365
Azure AI Services: Deploy gerenciado com escala automatica e SLA enterprise
Microsoft Graph: Acesso a dados organizacionais (emails, calendarios, documentos)
Copilot Studio: Interface visual para criar workflows agenticos sem codigo

💻 Coding agents com Docker

Uma das features mais distintas do AutoGen e a capacidade de executar codigo gerado por agentes em containers Docker isolados. Quando um AssistantAgent gera codigo Python, o UserProxyAgent pode executa-lo automaticamente dentro de um container Docker — isolamento total do sistema host. Se o codigo gerar erro, o AssistantAgent recebe o traceback e corrige iterativamente ate funcionar.

Esse pattern — gerar, executar, corrigir, repetir — e extremamente poderoso para tarefas de analise de dados, automacao e desenvolvimento. O agente escreve um script de analise, executa no Docker, ve o output (ou erro), ajusta o codigo e repete. Em 3-5 iteracoes, geralmente chega a um resultado correto. A seguranca do Docker garante que mesmo codigo malicioso ou bugado nao afeta o sistema host.

💡 Seguranca na execucao

Como Docker garante seguranca:

• Isolamento total: Codigo roda em container efemero — sem acesso ao filesystem host
• Recursos limitados: CPU, memoria e rede controlados — sem risco de resource exhaustion
• Descartavel: Container destruido apos execucao — sem residuos ou side effects
• Iterativo: Erro no codigo → traceback enviado ao agente → correcao automatica → nova tentativa

📊 Resultados praticos

Taxa de sucesso: 85%+ das tarefas de analise de dados resolvidas em menos de 5 iteracoes
Seguranca: Zero incidentes de seguranca reportados com execucao via Docker
Linguagens: Python, JavaScript, Bash — qualquer linguagem com Docker image disponivel
Integracao: Instalar pacotes pip/npm dentro do container — acesso a todo o ecossistema

🗣️ GroupChat: conversacao multiagente

O GroupChat e o mecanismo do AutoGen para conversas com mais de dois agentes. Voce cria um grupo com multiplos agentes e um GroupChatManager que controla quem fala quando. O manager pode usar diferentes estrategias: round_robin (cada um fala na vez), random (aleatorio) ou auto (o LLM decide quem deve falar baseado no contexto da conversa).

O GroupChat brilha em cenarios de debate e refinamento. Imagine um grupo com um Researcher, um Critic e um Writer: o Researcher apresenta dados, o Critic questiona a validade, o Researcher refina sua analise, o Writer sintetiza o resultado. Esse ciclo de debate produz resultados mais robustos do que qualquer agente individual, porque cada perspectiva desafia e complementa as outras.

💡 Mecanica do GroupChat

Como conversas multiagentes funcionam:

• GroupChat: Container que agrupa multiplos agentes numa conversa compartilhada
• GroupChatManager: Controla turnos — decide quem fala a cada rodada
• Estrategias de turno: round_robin, random, auto (LLM decide), manual
• Max rounds: Limite de rodadas para evitar conversas infinitas — tipicamente 10-20

📊 Padroes de uso

Debate critico: Propositor + Critico + Sintetizador — refinamento por argumentacao
Pair programming: Developer + Reviewer — um escreve, outro revisa, iterativamente
Brainstorming: Multiplos especialistas contribuem ideias de perspectivas diferentes
Votacao: Multiplos agentes opinam e um sintetizador compila a decisao majoritaria

🔧 Tools e Function Calling

No AutoGen, tools sao funcoes Python registradas nos agentes usando register_function(). Quando o LLM determina que precisa de uma tool, ele gera uma chamada de funcao que o UserProxyAgent executa e retorna o resultado. O sistema suporta function calling nativo da OpenAI e Anthropic, garantindo chamadas de tools precisas e tipadas.

A flexibilidade esta na composicao: voce pode dar tools diferentes a agentes diferentes no mesmo GroupChat. O researcher tem acesso a busca web, o developer tem acesso a execucao de codigo, o analyst tem acesso a banco de dados. Cada agente usa apenas suas ferramentas, e a conversacao entre eles cria um workflow onde informacao flui naturalmente entre especializacoes.

💡 Sistema de tools

Como ferramentas funcionam no AutoGen:

• register_function(): Registra uma funcao Python como tool disponivel para o agente
• Function calling nativo: Usa o mecanismo nativo do provider (OpenAI, Anthropic)
• Return values: Resultado da tool e inserido automaticamente na conversa
• Tools por agente: Cada agente no GroupChat pode ter suas proprias tools exclusivas

📊 Exemplos de tools

Busca web: Pesquisar informacoes em tempo real via APIs de busca
Execucao de codigo: Rodar scripts Python/JS via Docker ou local
Banco de dados: Consultar, inserir e atualizar dados em SQL ou NoSQL
APIs externas: Integrar com qualquer servico via HTTP requests

📊 Quando usar AutoGen vs CrewAI vs LangGraph

A escolha entre AutoGen, CrewAI e LangGraph depende do problema que voce esta resolvendo. AutoGen brilha em cenarios conversacionais — debate entre agentes, pair programming, brainstorming. CrewAI e ideal para equipes com papeis definidos — pesquisa + escrita, planejamento + execucao. LangGraph oferece controle maximo — workflows com compliance, human-in-the-loop, checkpointing.

Uma regra pratica: se seus agentes precisam debater e iterar, use AutoGen. Se seus agentes tem papeis claros e tarefas definidas, use CrewAI. Se voce precisa de controle total sobre cada decisao de roteamento, use LangGraph. Em projetos grandes, nao e incomum combinar frameworks — LangGraph para o fluxo principal com CrewAI para sub-workflows de equipe.

💡 Tabela comparativa

Criterios de decisao entre os tres frameworks:

• AutoGen: Conversacional, debate, pair programming — agentes que discutem e refinam
• CrewAI: Role-based, equipes com cargos, tarefas estruturadas — intuitivo e produtivo
• LangGraph: Graph-based, controle total, checkpointing, HITL — enterprise e compliance
• Combinacao: LangGraph como backbone + CrewAI para sub-equipes + AutoGen para debates

📊 Guia de decisao rapida

Prototipo rapido? CrewAI — mais facil de comecar e iterar
Debate e consenso? AutoGen — coordenacao conversacional natural
Compliance/auditoria? LangGraph — controle total e rastreabilidade
Ecossistema Microsoft? AutoGen/Agent Framework — integracao nativa

📚 Resumo do Modulo

✓

AutoGen: conversacional - Coordenacao via dialogo entre agentes

✓

MS Agent Framework - AutoGen + Semantic Kernel unificados para enterprise

✓

Coding com Docker - Execucao segura de codigo em containers isolados

✓

GroupChat multiagente - Debate estruturado entre multiplos agentes

✓

Tools e Function Calling - Funcoes Python como ferramentas dos agentes

✓

Comparacao de frameworks - Conversacional vs role-based vs graph-based

Proximo:

Modulo 2.6 - Protocolos MCP, A2A, ACP

← Modulo 2.4 - oh-my-openagent Modulo 2.6 - Protocolos MCP, A2A, ACP →