Claude agents que aprendem sozinhos: Dreaming, Outcomes e orquestração multi-agente
A Harvey, plataforma de IA jurídica, reportou 6x de melhoria na taxa de conclusão dos seus agentes depois de ativar memória entre sessões. A Netflix processa centenas de builds por dia com um agente que identifica padrões em milhares de aplicações, algo inviável para uma equipe humana na mesma escala.
Os dois rodam no Claude Managed Agents, a plataforma da Anthropic para agentes autônomos. E as três atualizações de hoje explicam esses resultados e indicam para onde automação com IA está indo.
Contexto rápido: o que é Managed Agents
Managed Agents é diferente de usar o Claude no chat. É uma plataforma para construir agentes que executam trabalho: ler documentos, escrever relatórios, rodar fluxos de vários passos, coordenar com outros sistemas. A plataforma cuida de memória persistente, histórico de sessões e execução de tarefas longas.
As três atualizações: Dreaming, Outcomes e orquestração multi-agente.
Dreaming: o agente que refina o que sabe enquanto você não está olhando
Todo agente acumula memória durante o uso (o que funcionou, o que não, preferências do usuário). O problema é que essa memória cresce sem critério. Informações úteis se misturam com ruído.
Dreaming é um processo separado que roda entre sessões. Ele analisa o histórico acumulado do agente e faz três coisas:
- Identifica padrões: erros recorrentes, fluxos que sempre convergem para o mesmo formato, preferências da equipe
- Reestrutura a memória: mantém o que é sinal, descarta o que é ruído
- Compartilha entre agentes: aprendizados de um agente podem beneficiar outros do mesmo time
A metáfora da Anthropic é precisa: memória captura aprendizado durante o trabalho; dreaming processa e consolida entre sessões. O mesmo princípio pelo qual humanos consolidam aprendizados durante o sono.
Para projetos longos, onde o agente trabalha semanas no mesmo contexto, a diferença é material. O agente da segunda semana é melhor que o da primeira.
Disponível em research preview, acesso sob pedido.
Outcomes: rubricas de qualidade que o agente aplica sozinho
+8,4% na qualidade de arquivos .docx gerados. +10,1% em .pptx. +10 pontos na taxa de conclusão de tarefas. Esses são os números que a Anthropic publicou no anúncio sobre Outcomes.
O mecanismo: você define uma rubrica de qualidade, ou seja, o que o output precisa ter para ser considerado bom. Um processo independente avalia o que o agente produziu contra essa rubrica. Se não atingir o padrão, o agente recebe feedback e tenta de novo.
Funciona para critérios objetivos (o documento tem a seção X? está no formato certo?) e subjetivos (o tom está alinhado com a marca? a argumentação é convincente?).
O ponto importante: o loop de autocorreção acontece sem intervenção humana. O agente entrega o resultado final, não o rascunho.
Em public beta.
Orquestração multi-agente: um coordena, os especialistas executam
A Spiral, plataforma de escrita do Every, usa Haiku para triagem e classificação de tarefas (rápido, ~US$ 0.25/milhão de tokens) e Opus para redigir o que importa (mais capaz, ~US$ 15/milhão). Um agente principal coordena; especialistas executam em paralelo.
Multiagent orchestration formaliza esse padrão na plataforma. Um agente líder delega partes do trabalho para subordinados com modelos, prompts e ferramentas diferentes. Os especialistas operam em paralelo, compartilham um sistema de arquivos comum e mantêm registro de tudo.
O Claude Console mostra a cadeia completa: quem delegou o quê, quando, com qual resultado. Rastreabilidade do fluxo inteiro.
Para tarefas complexas, onde um único agente teria que ser bom em tudo, a divisão em especialistas permite usar o modelo certo para cada etapa. Barato onde pode, capaz onde precisa.
Mais um caso real: Wisedocs
A Wisedocs lida com documentação médica. O agente de verificação de qualidade reduziu o ciclo de revisão em 50%, mantendo alinhamento com os padrões da equipe. Contexto regulado, onde erros custam caro. Exatamente o tipo de ambiente onde Outcomes faz diferença.
O que isso sinaliza
Dreaming, Outcomes e orquestração multi-agente não são botões que você aperta no chat. São avanços de infraestrutura para quem está construindo sistemas com IA.
Mas a direção é clara: agentes que melhoram com o uso, que aplicam padrões de qualidade de forma automática, que dividem trabalho especializado em paralelo. A barreira entre “assistente que responde” e “sistema que executa processos” está diminuindo a cada trimestre.
Se você está avaliando automações para o seu negócio, esses avanços mudam o que é razoável esperar de um agente. O que há seis meses exigia orquestração manual agora é configurável.
Para entender os fundamentos: o que são AI agents e como funcionam e o que é MCP.
Para implementar agentes de IA no seu negócio: veja como posso ajudar.



COMENTÁRIOS
Nenhum comentário ainda.