O que aconteceu — e por que me preocupa
A Meta investiu na Manus AI, uma plataforma de agentes que não fica no chat. O agente ganha uma VM, pesquisa coisas na internet, gera documentos, apresentações, relatórios. Entregáveis reais. Não sugestão — execução.
E eu fico pensando: uma VM rodando código autônomo, sem humano olhando, fazendo pesquisa na internet e gerando artefatos que vão parar na mão de alguém como “produto final”. Isso me incomoda. Não pela tecnologia em si — pelo gap entre o que a coisa faz e o que as pessoas acham que ela faz.
O salto de “sugere” pra “executa”
Até agora, LLMs sugeriam. Você lia, editava, decidia. Agora o agente faz. Pesquisa e compila informações. Gera a apresentação inteira. Executa a rotina operacional. Interage com APIs.
A diferença não é incremental — é categórica. Sugestão errada, você ignora. Execução errada, já foi.
Tip
Avalie casos de uso: pesquisa, geração de assets e rotinas operacionais repetitivas são os primeiros candidatos para agentes com execução real.
O problema do controle
Quando o agente opera dentro de uma VM, o escopo do que pode dar errado expande drasticamente. Já imaginaram um agente fazendo pesquisa na internet pra montar um relatório de due diligence — e puxando dado de um site falso? Ou gerando uma apresentação com número inventado que ninguém confere porque “o agente fez”?
Os guardrails óbvios:
- Permissões granulares — o que o agente pode acessar, modificar, enviar
- Checkpoints humanos — antes de qualquer ação irreversível, alguém olha
- Tetos — de custo, de tempo, de escopo
Warning
Defina guardrails claros: permissões, revisão humana e limites para tarefas críticas. Agente autônomo sem controle é risco, não inovação.
Mas sendo realista: a pressão vai ser pra remover esses checkpoints. “Tá lento demais com human-in-the-loop.” Eu já ouvi isso em contextos menores. Imagina com agentes que prometem executar pipelines inteiros.
O que de fato vai acontecer
Com o dinheiro da Meta, a Manus escala. Outras plataformas vão copiar. Em algum momento, alguém vai rodar um agente em produção sem guardrails porque “funciona no demo” e vai dar merda. Não é se — é quando.
A pergunta que importa não é “o que agentes com VM conseguem fazer” — é “quem é responsável quando dá errado.” E essa pergunta, por enquanto, ninguém tá respondendo.
Publicado originalmente no LinkedIn.