
Andrej Karpathy em estúdio, durante conversa com Dwarkesh Patel sobre o ritmo real do progresso em IA. Foto: divulgação Dwarkesh Podcast.
Karpathy: 'É a década do agente, não o ano do agente' — por que o hype atual está calibrado errado
Em uma das passagens mais comentadas da entrevista que deu ao podcaster Dwarkesh Patel — gravação publicada no fim de outubro de 2025 e ainda fortemente repetida no Twitter dos pesquisadores em março e abril de 2026 —, Andrej Karpathy disse uma frase que destoava do hype dominante. Não era 'o ano do agente', como anunciavam algumas chamadas de conferência. Era, segundo ele, 'a década do agente'. A diferença entre uma palavra e a outra parece pequena, mas ela contém praticamente toda a discussão honesta sobre onde estamos, onde não estamos e quanto tempo falta.
Vamos situar o contexto. A frase só faz sentido se entendermos contra o que ela está reagindo.
Em 2024 e 2025, empresas e laboratórios apresentaram, com graus variados de seriedade, que 2025 seria o "ano do agente". A ideia era simples. Os modelos de linguagem grandes tinham finalmente chegado a um ponto em que podiam executar tarefas de várias etapas sem supervisão constante — resultado direto dos avanços em técnicas de treinamento como o reinforcement learning, que ensinam os modelos a encadear decisões de forma autônoma. Agendar reuniões. Fazer compras. Navegar páginas web. Escrever código sem revisão linha por linha.
Karpathy não negou que a direção fosse importante. Negou que ela coubesse num ano.
Os quatro buracos que ele apontou
Na conversa com Dwarkesh, Karpathy elenca quatro coisas que ainda faltam para um agente funcionar como estagiário confiável. Fala com a calma de quem descreve um diagnóstico, não uma profecia.
A primeira é a multimodalidade plena. Os modelos de hoje leem texto, leem imagens com boa precisão e entendem áudio. Mas ainda tropeçam em muitas modalidades: vídeo longo, controle motor, percepção espacial fina, voz com nuances emocionais sustentadas por horas. Vale lembrar que, mesmo em tarefas mais restritas, agentes iterando autonomamente sobre seu próprio código de treinamento já demonstraram capacidade de encontrar melhorias consistentes — o que torna ainda mais evidente o quanto falta para costurar todas essas competências num único sistema que te ajude no mundo real.
A segunda é o uso de computador (computer use). É a capacidade do modelo de operar realmente um computador, não só descrever o que faria. Clicar em botões de aplicativos antigos. Lidar com janelas que travaram. Reagir quando uma página carrega diferente do esperado. Essa autonomia operacional é justamente o que alimenta a visão de agentes capazes de executar software sob medida para cada usuário — quem já viu uma demonstração de agente perdida num pop-up de cookie sabe do que ele fala.
A terceira é o aprendizado contínuo. Os modelos atuais são congelados depois do treinamento. Quando você ensina algo novo, nada disso persiste. Na próxima sessão, o modelo não lembra que você corrigiu aquele erro ontem. É justamente essa limitação que faz desenvolvedores como Andrej Karpathy relatarem uma sensação crescente de defasagem profissional: para um estagiário ser útil, ele precisa pelo menos lembrar quem é você e o que pediu na semana passada.
A quarta é a memória propriamente dita. Não a janela de contexto curta, mas a capacidade de organizar experiência ao longo de meses e anos. Recuperar o que importa. Esquecer o que não importa. Usar essa biblioteca pessoal para tomar decisões — exatamente o tipo de capacidade que distingue um agente sofisticado de um simples executor de prompts, como Karpathy argumenta ao propor a engenharia agêntica como substituta do vibe coding.
Cada uma dessas quatro coisas, sozinha, é problema de pesquisa em aberto. As quatro juntas, segundo Karpathy, somam cerca de uma década de trabalho. Não um trimestre.
"Um sinal magro propagado para um ato grande"
Há um detalhe técnico que vale trazer. Karpathy o repetiu em outras entrevistas e tweets, incluindo no post Animals vs Ghosts do blog dele.
Os modelos atuais aprendem a se comportar bem em tarefas de várias etapas usando reinforcement learning. A ideia é simples. O modelo tenta a tarefa inteira. No fim, mede-se se ele se saiu bem ou mal. Depois, ajustam-se os parâmetros para tornar mais provável que ele repita o que funcionou.
Karpathy descreve esse processo com uma imagem particular. Diz que é como sugar a supervisão por um canudo. A trajetória inteira — milhares de passos, cada um com nuances, escolhas finas e momentos críticos — recebe no final um único sinal de "certo" ou "errado". Esse sinal magro é propagado para cima e tenta moldar o comportamento de cada passo intermediário.
É um método que funciona. Mas é forma muito ineficiente de ensinar. Animais não aprendem assim. Aprendizes humanos não aprendem assim. Aprendem com sinais ricos, frequentes, contextuais. E por isso aprendem rápido com pouco dado.
A leitura de Karpathy é direta. Enquanto não tivermos formas melhores de dar feedback rico aos modelos, teremos ganhos em RL, mas não o salto que transformaria o agente atual num assistente confiável.
Por que "década" é boa notícia
Aqui a coluna se afasta um pouco do tom sóbrio do original e arrisca uma leitura.
Quando Karpathy diz "década", não está sendo pessimista. Está sendo realista de um modo que, no fundo, anima.
Anima porque significa que ainda há trabalho técnico substancial a fazer. Não apenas ajustar prompts e conectar APIs. Anima porque o desenvolvedor que entra agora tem dez anos de problemas abertos pela frente, não três meses de "tudo já foi resolvido". Anima porque a fronteira da pesquisa não foi capturada pelos cinco laboratórios que pagam mais salário — ainda há espaço para descobertas vindas de quem tem GPU sobrando e curiosidade.
E anima, sobretudo, porque o "ano do agente" prometia demais e entregava pouco. Quando o prometido demais não aparece, o público desanima. Quando o prometido em dez anos aparece com seis meses de antecedência, o público se anima. O ritmo realista é o que sustenta o campo no longo prazo.
A leitura para o Brasil
Se você é programador, gestor ou estudante no Brasil, e tenta decidir se vale investir tempo em agentes em 2026, a frase de Karpathy ajuda a calibrar a expectativa.
Sim, vale investir. As ferramentas atuais já servem a casos concretos: tradução, geração de código, resumo, busca estruturada, transcrição, classificação. Tudo isso funciona bem e melhora a cada trimestre.
Mas não conte com o agente que faz tudo sozinho até 2030. Conte com um colega digital que ajuda em fatias específicas e exige supervisão constante. O ofício de quem vai trabalhar bem com IA nos próximos anos vai parecer mais com edição assistida do que com terceirização total.
Enquanto isso, vá aprendendo a descrever bem o que quer. Essa habilidade — escrita técnica clara, problemas bem definidos, critérios de sucesso explícitos — vai escalar quando as outras quatro peças entrarem no lugar.
A década do agente vai chegar. Karpathy só está pedindo paciência calibrada.
Fonte original: entrevista de Andrej Karpathy ao podcast de Dwarkesh Patel (out/2025, repercussão sustentada em mar-abr/2026), tweet de referência @karpathy e ensaio Animals vs Ghosts no blog pessoal dele.
Perguntas Frequentes
- Por que Karpathy diz que é a década do agente e não o ano do agente?
- Segundo Karpathy, ainda faltam quatro elementos críticos para agentes realmente funcionarem: multimodalidade plena, uso de computador, aprendizado contínuo e memória. Cada um desses problemas de pesquisa levaria cerca de uma década para ser resolvido completamente.
- Quais são os quatro buracos que Karpathy apontou?
- Multimodalidade plena (vídeo longo, controle motor, percepção espacial), uso de computador (operar interfaces, lidar com erros), aprendizado contínuo (reter conhecimento entre sessões) e memória de longo prazo (organizar experiência ao longo de meses).
- Qual é o risco do hype atual em agentes?
- O hype de 2025 subestimou o tempo necessário para desenvolver agentes confiáveis. Karpathy alerta que esperar resultados de um trimestre é ilusório quando a realidade demanda uma década de progresso contínuo.
Receba o Mirante no seu email
As principais notícias do dia, curadas por inteligência artificial, direto na sua caixa de entrada.