Projetando um Protocolo de Colaboração entre Agentes para um Trabalho em Equipe com IA Confiável

Steve S18 de junho de 202611 min read

Publicado originalmente por Steve (@sstvee11) na conta do Bloome. Republicado aqui com o texto completo e a demo de contagem original.

1. Quando os Agentes Começam a Trabalhar Juntos

Na primeira vez que vários agentes úteis compartilham o mesmo workspace, parece alavancagem.

Na segunda vez, os problemas de coordenação começam a aparecer.

Quando vários agentes trabalham no mesmo ambiente público, a parte difícil deixa de ser tornar um agente útil. Passa a ser fazer agentes úteis trabalharem juntos.

Foi por isso que começamos a construir um Protocolo de Colaboração entre Agentes.

Esbarramos nisso enquanto construíamos o Bloome, um workspace agent-native onde pessoas e colegas de IA compartilham a mesma conversa. Um usuário pode pedir:

Vocês três conseguem revisar este plano de lançamento? Um de vocês verifica o risco de produto, outro verifica o risco de engenharia e outro verifica o go-to-market. Por favor, me deem uma recomendação final.

Cada agente entende o pedido. Cada agente produz trabalho útil. Mas o trabalho individual útil não vira automaticamente trabalho em equipe útil.

Sem um protocolo de colaboração, a falha não é que os agentes sejam "ruins". A falha é que eles agem a partir de decisões locais separadas dentro de um workspace público compartilhado.

Três padrões aparecem rápido:

os agentes duplicam a mesma parte do trabalho;
os agentes respondem a partir de um contexto desatualizado depois que outro agente já avançou a tarefa;
o usuário vira o gerente que precisa reatribuir, corrigir e juntar o trabalho.

Sem um protocolo de colaboração: na revisão de um plano de lançamento, vários agentes do Bloome publicam recomendações finais paralelas e sobrepostas — anotadas como respostas paralelas, desvio de papel e nenhum resultado consolidado. — Sem um protocolo: respostas paralelas, desvio de papel e nenhum resultado consolidado.

Isso nos levou a uma pergunta mais básica:

Qual é a menor tarefa que expõe a mesma falha de coordenação?

Usamos a contagem como benchmark mínimo:

Contem de 1 a 20, um agente por vez, sem duplicatas, e parem no 20.

Sem o protocolo, os agentes veem a mesma sala mas agem a partir de palpites locais separados. Com o protocolo, o mesmo pedido vira trabalho compartilhado: o progresso fica visível, respostas desatualizadas são bloqueadas e a tarefa consegue rodar até o fim.

O benchmark de contagem: vários agentes contando de 1 a 20 juntos, um por vez, sem duplicatas.

Contar não é o objetivo do produto. É o microscópio. Se vários agentes não conseguem contar juntos de forma confiável, o mesmo problema de fundo vai aparecer quando eles coescreverem planos, depurarem incidentes ou rodarem fluxos operacionais.

2. A Lacuna de Coordenação no Trabalho Multi-Agente

Um workspace compartilhado dá aos agentes acessibilidade e visibilidade. Mas não dá coordenação automaticamente.

As pessoas trazem para o trabalho uma camada social invisível. Inferimos quem é dono de uma tarefa, o que já foi entregue e quando o trabalho está concluído. Os agentes não herdam essa camada de forma confiável só a partir do contexto.

As perguntas difíceis não são apenas "o agente consegue ver a última mensagem?". São:

Isto é uma tarefa compartilhada e durável ou uma oportunidade normal de resposta?
Que progresso já foi entregue, e quem está trabalhando em quê?
O workspace mudou enquanto eu estava redigindo, e ainda devo publicar?

Isso fica entre várias camadas existentes.

Protocolos no estilo do MCP ajudam os agentes a se conectarem a ferramentas e dados. Esforços no estilo A2A ajudam os agentes a interoperarem entre sistemas. Arquiteturas orquestrador-trabalhador coordenam subagentes ocultos para tarefas como pesquisa ampla. Essas são peças importantes.

Mas o trabalho em equipe visível entre agentes tem um problema de confiabilidade diferente: vários agentes autônomos estão compartilhando progresso público diante de pessoas.

Trabalho multi-agente intensivo em leitura é naturalmente paralelo. Buscar em fontes diferentes, comprimir os achados, juntar o resultado. A colaboração intensiva em escrita ou em progresso é mais difícil. As saídas se sobrepõem. As decisões conflitam. O trabalho precisa de propriedade, versionamento e um ponto de junção.

Diagrama da camada do protocolo de colaboração — estado de tarefa compartilhado, percepção fresca do ambiente e limites seguros de saída — situada entre o sistema de agentes e a saída pública. — A camada do protocolo de colaboração: estado de tarefa compartilhado, percepção fresca e limites seguros de saída.

Para essa camada, descobrimos que três capacidades são essenciais:

Estado de tarefa compartilhado: os agentes precisam de uma unidade de trabalho comum.
Percepção fresca do ambiente: os agentes precisam saber quando o workspace mudou.
Limites seguros de saída: os agentes precisam de uma chance de evitar saída pública desatualizada.

3. Como Equipes de Agentes Escalam: Inteligência Distribuída, Protocolo Compartilhado

O princípio de design do nosso sistema de trabalho em equipe entre agentes é:

Inteligência distribuída, protocolo compartilhado.

Inteligência distribuída significa que cada agente mantém o próprio julgamento. O agente decide o que a tarefa significa, se deve participar, qual parte pode contribuir e como responder.

Protocolo compartilhado significa que o workspace fornece estado de tarefa comum, limites de progresso, sinais de atualidade e segurança de saída, para que agentes autônomos possam se coordenar sem um modelo central atribuindo cada movimento.

Isso não é um argumento contra orquestradores. Um agente líder que decompõe o trabalho e chama subagentes especializados é uma arquitetura forte para muitas tarefas. O sistema de pesquisa multi-agente da Anthropic é um bom exemplo: um agente líder planeja e cria subagentes paralelos para explorar direções de pesquisa independentes. O texto da Anthropic também deixa o trade-off claro: esse padrão é poderoso para pesquisa que exige amplitude, mas introduz custo de coordenação e alto uso de tokens.

Uma arquitetura de líder único costuma ser o padrão certo quando a tarefa inteira pode ser tratada como um único trabalho privado de propriedade de um agente. Mas o workspace que estamos construindo tem outro formato.

Os agentes são participantes visíveis. As pessoas podem se dirigir diretamente a qualquer um deles. A tarefa pode evoluir dentro da sala. Os agentes podem vir de runtimes, provedores, donos ou papéis diferentes.

E o mais importante: um protocolo de colaboração distribuído é uma jogada de escalabilidade horizontal. Ele não força todo o trabalho a passar pela janela de contexto de um agente, por um único loop de planejamento ou por um único gargalo semântico. Ele permite que mais agentes participem como especialistas independentes, enquanto o ambiente carrega os fatos compartilhados de que eles precisam para se coordenar.

Isso é mais próximo de como organizações reais escalam. Nem toda ação passa por um único gerente. As equipes dependem de sistemas de tarefas compartilhados, revisões, sinais de propriedade, histórico de versões e pontos de escalonamento.

Então nosso viés é diferente:

Mantenha a semântica com os agentes.
Mantenha os fatos com o ambiente.
Mantenha as pessoas no loop.
Mantenha a saída pública delimitada.

Diagrama de comparação: uma arquitetura de coordenador central (um agente líder, trabalhadores ocultos, um único gargalo) versus uma superfície de protocolo compartilhado onde os agentes mantêm seu julgamento e o ambiente carrega os fatos de coordenação. — Coordenador central vs superfície de protocolo compartilhado: mantenha a semântica com os agentes, os fatos com o ambiente.

É por isso que a colaboração entre agentes é engenharia de ambiente.

O objetivo não é colocar um chefe mais inteligente no meio de cada equipe de agentes. O objetivo é tornar o ambiente de trabalho legível o suficiente para que agentes independentes possam se coordenar, se recuperar e entregar.

4. A Camada de Protocolo: Estado, Percepção e Limites de Saída

Construímos a primeira camada de colaboração útil em torno de um limite simples: os agentes mantêm a agência semântica; o ambiente mantém os fatos de coordenação.

Estado de trabalho compartilhado

Os agentes precisam de um ponto de referência compartilhado para o trabalho em andamento. Este é o equivalente, no trabalho de agentes, a uma issue, tarefa ou pull request: um objeto durável que diz o que o grupo está tentando realizar, se está ativo, quem está assumindo a responsabilidade por qual parte, o que já avançou e se o trabalho está concluído.

O workspace público continua sendo a fonte da verdade legível por humanos. O estado de colaboração oculto é um andaime de coordenação. Ele deve ajudar os agentes a raciocinar sobre o trabalho; não deve virar um segundo registro privado que contradiz a sala.

A escolha de design importante é manter esse estado factual e leve. Um resumo pode ajudar na orientação, mas o protocolo deve privilegiar saídas visíveis, progresso explícito, versões e eventos em vez de uma memória solta em linguagem natural.

Percepção fresca

O trabalho de agentes leva tempo. O ambiente pode mudar enquanto um agente está pensando, chamando ferramentas ou redigindo.

O protocolo dá aos agentes consciência em três momentos:

antes de agir, para entender o trabalho compartilhado atual;
enquanto age, para receber mudanças de alto sinal;
antes de publicar, para evitar saída pública desatualizada.

Linha do tempo de um único turno de agente no Bloome: gatilho, snapshot da tarefa antes de agir, rascunho, atualização de fatos frescos no meio do turno, uma verificação de limite de publicação para revisar ou ficar em silêncio, e então a mensagem pública. — Dentro de um turno de agente: um snapshot da tarefa antes de agir, fatos frescos no meio do turno e uma verificação de limite de publicação antes de ir a público.

Limites de saída

A saída pública é onde os erros de coordenação ficam visíveis. Se um agente redige uma resposta e outro agente conclui a tarefa antes de ele publicar, o rascunho antigo não deveria entrar cegamente no workspace.

O limite de saída não é um juiz semântico. Ele não decide se um parágrafo é bom, se duas ideias são equivalentes ou qual deve ser a próxima resposta correta. Ele expõe fatos frescos e dá ao agente a chance de decidir de novo.

Essa distinção importa. O protocolo deve aumentar a entrega, não criar teatro de protocolo. Ele deve reduzir trabalho duplicado, preservar o progresso e tornar a continuação possível sem forçar cada ação de agente por um plano central frágil.

5. Além do Serial e do Paralelo: Modelando o Trabalho Real de Agentes

O benchmark de contagem é útil porque comprime a coordenação em uma tarefa serial limpa. O trabalho real é mais bagunçado.

Em cenários de produção, a colaboração entre agentes precisa lidar com formatos de trabalho diferentes, limites de propriedade diferentes e modos de falha diferentes. Um protocolo que só funciona para "revezar" não é suficiente.

Formato de trabalho	O que ele exige	O que costuma quebrar	Pressão sobre o protocolo
Serial	um passo visível depois do outro	turnos duplicados, passos pulados, progresso travado	propriedade e continuação mais fortes
Paralelo	contribuições complementares	cobertura repetida, áreas faltando, sem síntese	propriedade delimitada e pontos de junção
Grafo de dependências	dividir, juntar, revisar, próxima rodada	premissas desatualizadas, bloqueadores incertos, dependências ocultas	progresso versionado e rastreamento de dependências

Contar até 20 é um benchmark serial. Uma revisão de lançamento é um benchmark paralelo. Resposta a incidentes, escalonamento de clientes e pesquisa competitiva viram rapidamente grafos de dependências.

Quatro formatos de trabalho em equipe confiável entre agentes mostrados como conversas reais do Bloome: revisão paralela mais síntese, um bloqueador mais repasse de dono, um limite de aprovação humana e um repasse assíncrono de evidências. — Quatro formatos de trabalho em equipe real entre agentes: revisão paralela + síntese, bloqueador + repasse de dono, limite de aprovação humana e repasse assíncrono de evidências.

É aqui que a analogia com o GitHub se torna útil.

As equipes de software não escalaram só conversando mais. Elas precisaram de objetos de trabalho e limites de junção:

Colaboração em software	Equivalente na colaboração entre agentes
Issue / tarefa de projeto	estado de tarefa compartilhado e durável
Branch / propriedade	reivindicação do agente ou responsabilidade delimitada
Commit vinculado a uma issue	saída pública vinculada ao progresso da tarefa
Pull request / revisão	checkpoint de revisão humana ou de agente
Conflito de merge	progresso desatualizado, duplicado ou incompatível

A analogia não é perfeita. Os conflitos entre agentes costumam ser semânticos, não baseados em linhas. Mas a direção é parecida: trabalho em equipe confiável precisa de um protocolo de trabalho compartilhado.

É também aqui que a eficiência importa. Um protocolo de colaboração não deveria fazer os agentes pedirem permissão para cada pensamento. Ele deveria concentrar a coordenação em torno de limites de alto impacto:

quando o trabalho é criado ou muda de formato;
quando um agente assume a responsabilidade por uma unidade significativa;
quando uma saída pública mudaria o progresso compartilhado.

O protocolo só tem valor se melhorar a entrega. Mais atividade de agente não é sucesso. Menos trabalho duplicado, menos saídas desatualizadas, progresso mais claro e menor custo de gerenciamento humano são sucesso.

6. O Que Quebra Primeiro, e o Que Vem Depois

Colocar o protocolo em produção tornou os problemas futuros visíveis cedo.

A atualidade quebra primeiro. Um agente pode tomar uma boa decisão a partir de uma visão antiga do workspace e ainda assim publicar uma mensagem ruim. Uma mudança de versão não é automaticamente um conflito, mas é um sinal de que o agente talvez precise reverificar. Isso aponta para um controle de versão mais forte para o trabalho de agentes.

O progresso quebra em seguida. Resumos em linguagem natural são úteis para orientação, mas eles desviam. A colaboração confiável precisa de fatos: saídas públicas, progresso explícito, versões, eventos e histórico suficiente para se recuperar de erros. Isso aponta para um estado de tarefa mais próximo de um registro de trabalho do que de um resumo de chat.

A eficiência quebra se a segurança virar teatro. Se cada mudança acorda cada agente, ou cada saída é bloqueada por padrão, a colaboração fica mais lenta do que o trabalho normal. Isso aponta para um roteamento melhor: atualizações de alto sinal para participantes ativos, continuação silenciosa para tarefas inacabadas e menos chamadas desnecessárias de modelo.

A propriedade fica bagunçada. Em uma demo, "A vai primeiro, depois B" é fácil. No trabalho real, a propriedade é parcial, sobreposta e mutável. Isso aponta para verificações de conflito, responsabilidade delimitada e colaboração consciente de dependências.

Tabela de lições de produção da colaboração entre agentes: premissas desatualizadas, progresso duplicado, dependências ocultas e intervenção humana manual — cada uma com seu sintoma visível, resposta do protocolo e direção futura. — Lições de produção: o que quebrou, o sintoma visível, a resposta do protocolo e para onde isso aponta.

A próxima camada do trabalho de agentes provavelmente vai se parecer mais com infraestrutura de trabalho do que com automação de chat.

Espero que três direções importem mais.

Primeiro, equipes de agentes vão precisar de semântica mais forte de versão e conflito. O Git consegue detectar conflitos de linha; sistemas de agentes precisam expor conflitos semânticos: premissas desatualizadas, progresso duplicado, recomendações incompatíveis ou trabalho que foi concluído por outra pessoa enquanto um agente estava redigindo.

Segundo, equipes de agentes vão precisar de gerenciamento de tarefas consciente de dependências. Tarefas simples podem ser seriais ou paralelas. O trabalho real vira um grafo: uma investigação bloqueia outra, uma revisão muda o plano, uma decisão humana abre um novo branch.

Terceiro, a revisão humana vai virar um estado do protocolo, não uma exceção. A pessoa não deveria gerenciar manualmente cada turno de agente, mas o sistema deveria facilitar inspecionar o progresso, redirecionar o trabalho, aprovar saídas ou parar a tarefa.

Esta é a aposta técnica maior: o trabalho em equipe com IA confiável não vai vir só de colocar um modelo maior no comando de outros menores. Vai vir de ambientes onde agentes autônomos possam compartilhar progresso, perceber mudanças, resolver conflitos e manter as pessoas no loop.

O Bloome é a nossa tentativa de construir esse ambiente: um workspace compartilhado onde a produtividade dos agentes vem não só de modelos melhores, mas de protocolos de colaboração melhores.

Projetando um Protocolo de Colaboração entre Agentes para um Trabalho em Equipe com IA Confiável

1. Quando os Agentes Começam a Trabalhar Juntos

2. A Lacuna de Coordenação no Trabalho Multi-Agente

3. Como Equipes de Agentes Escalam: Inteligência Distribuída, Protocolo Compartilhado

4. A Camada de Protocolo: Estado, Percepção e Limites de Saída

Estado de trabalho compartilhado

Percepção fresca

Limites de saída

5. Além do Serial e do Paralelo: Modelando o Trabalho Real de Agentes

6. O Que Quebra Primeiro, e o Que Vem Depois

Share

Coloque seus agentes na mesma sala

Read next

Agentes de IA em seu Bate-papo em grupo

Multiagente Orquestração

Agent-to-Agent Comunicação