Ataques a agentes de IA disparam em 2025, aponta pesquisa

Relatório revela que ataques contra agentes de IA no 4º trimestre de 2025 tiveram como principal alvo o vazamento de prompts de sistema (60%), seguidos por tentativas de burlar controles de conteúdo (20%) e ações de reconhecimento para mapear vulnerabilidades (12%)

O avanço dos agentes de IA para aplicações reais de negócios já está sendo acompanhado de perto por cibercriminosos. Um novo relatório da Lakera, empresa da Check Point Software, mostra que o vazamento de prompts de sistema respondeu por cerca de 60% de todo o tráfego de ataque observado no quarto trimestre de 2025, tornando-se o principal vetor de risco para sistemas de IA baseados em agentes.

A análise foi conduzida a partir de ataques reais registrados em aplicações protegidas pelo Lakera Guard e em interações no ambiente Gandalf: Agent Breaker. Os dados indicam que, à medida que agentes de IA passam a ler documentos, acessar fontes externas, acionar ferramentas e executar fluxos automatizados de múltiplas etapas, os atacantes ajustam rapidamente suas táticas para explorar cada nova capacidade introduzida.

De acordo com o relatório, os ataques contra agentes de IA no quarto trimestre de 2025 se concentraram em quatro objetivos principais. Como os vazamento de prompts de sistema foi a intenção mais comum, representando aproximadamente 60% do tráfego de ataque, com foco na extração das instruções internas que definem regras, funções e limites dos modelos.

Além das tentativas de burlar mecanismos de segurança de conteúdo apareceram como o segundo vetor mais frequente, respondendo por cerca de 20% dos ataques, geralmente disfarçadas como pedidos de análise, avaliações, transformações aparentemente inofensivas, como resumos e reescritas, ou cenários de simulação e role play.

O estudo mostra que as sondagens de intenção desconhecida corresponderam a aproximadamente 12% do tráfego, indicam atividades de reconhecimento, nas quais os atacantes testam limites e mapeiam vulnerabilidades dos sistemas. E ainda os vazamento de dados confidenciais, responsável por cerca de 8% dos ataques, evidenciou riscos diretamente ligados aos workflows automatizados dos agentes, que processam informações sensíveis ao longo de cadeias de decisão.

Segundo os pesquisadores da Lakera, a predominância do vazamento de prompts demonstra que os atacantes buscam compreender a lógica interna dos agentes antes de avançar para ataques mais complexos e direcionados.

O relatório também aponta o crescimento dos ataques indiretos, nos quais instruções maliciosas não são inseridas diretamente pelo usuário, mas ocultadas em documentos, páginas web ou conteúdos estruturados processados pelos agentes de IA. Esse modelo tem se mostrado mais eficiente do que a injeção direta de prompts, exigindo menos tentativas para ter sucesso e tornando-se um vetor de risco prioritário à medida que agentes são integrados a sistemas corporativos de busca, navegação e automação.

Os dados mostram ainda que muitas falhas de segurança não ocorrem no prompt inicial, mas durante a interação do agente com múltiplas fontes externas, ferramentas e tarefas em várias etapas, ampliando de forma significativa a superfície de ataque.

O quarto trimestre de 2025 revelou também os primeiros exemplos práticos de ataques que só se tornam possíveis em ambientes com agentes de IA, e que não existiam em modelos tradicionais de chatbots. Entre eles estão tentativas de extração de dados internos confidenciais, inserção de instruções com formato de script em cadeias automatizadas de processamento e manipulação de agentes por meio de fontes externas não confiáveis.

Esses padrões indicam que o risco deixa de se concentrar apenas no conteúdo gerado e passa a abranger todo o ciclo de decisão, execução e interação do agente. Para a Lakera, os achados do quarto trimestre de 2025 deixam claro que as organizações não podem tratar a segurança de agentes de IA como uma extensão dos modelos tradicionais de IA conversacional. Cada documento ingerido, ferramenta acionada, chamada externa ou decisão automatizada passa a representar um potencial ponto de comprometimento.

Diante desse cenário, a empresa alerta que preparar 2026 exige uma abordagem de segurança baseada em prevenção, visibilidade e controle contínuo ao longo de todo o fluxo operacional da IA, garantindo proteção não apenas no resultado final produzido pelos modelos, mas em todas as interações que sustentam seu funcionamento e impactam diretamente os processos de negócio.

Destaques

A IA ganhou corpo e o mundo vai sentir o impacto

Carnaval impulsiona nova onda de fraudes com Pix, deepfakes e engenharia social, alerta consultoria

CISOs defendem foco no fator humano para proteger acessos e identidades

Falta cultura de segurança quando o assunto é IA generativa?

IA impulsiona recorde de ciberataques globais, indica estudo

Adequação dos requisitos de SI no Bacen: O que esperar para o futuro?

Colunas & Blogs

O papel estratégico do DPO, CIO e CISO na gestão de riscos psicossociais: alinhando a NR01 à LGPD

Cristina Sleiman

Comunicação em Cyber: Qual o impacto do Social Styles na sua carreira?

Denis Nesi

A IA ganhou corpo e o mundo vai sentir o impacto

Fabio Correa Xavier

ROI e RONI em Cibersegurança: entendendo as diferenças e seu impacto estratégico

Fábio Araújo

Tendências da RSA Conference 2025 na visão de CISO Advisor

Glauco Sampaio

Quando o alerta do WEF fala de fraude, cabe perguntar: qual fraude?

Rodrigo Jorge

Cibersegurança como Política Pública: Parcerias Público-Privadas

Julio Signorini

Business Language: A Chave para a Cibersegurança Estratégica

Lucas Dartora

Aquisição da CyberArk pela Palo Alto aponta cenário de inflexão na Segurança de Identidade

Léia Machado, Mariana Nalesso Pó e Matheus Bracco

Competências equilibradas para os CISOs

Luiz Firmino

Resiliência Operacional: Alinhando Capacidades de Resiliência ao Futuro Digital

Renato Lima

Desmistificando o risco em IA

Rangel Rodrigues

Feliz 2026!

Rui Borges

Vazamento de dados em Pernambuco expõe desafios do Governo e reacende debate entre CISOs

Sergio Sermoud

Capacitação em Deep Learning e Inteligência Artificial para a Segurança Cibernética

Fabiana Tanaka

Conteúdos Relacionados

Security Report | Overview

Carnaval impulsiona nova onda de fraudes com Pix, deepfakes e engenharia social, alerta consultoria

Redbelt Security aponta crescimento de golpes com inteligência artificial e manipulação comportamental e defende que a principal vulnerabilidade da festa...

Security Report | Overview

Falta cultura de segurança quando o assunto é IA generativa?

Pesquisa da Cyberhaven mostra que 34,8% dos dados inseridos por funcionários em ferramentas de IA já são sensíveis e que...

Security Report | Overview

IA impulsiona recorde de ciberataques globais, indica estudo

Relatório de Cibersegurança 2026 da Check Point Software destaca o recorde global de ataques em 2025 e a IA tornando-se...

Security Report | Overview

Adequação dos requisitos de SI no Bacen: O que esperar para o futuro?

Banco Central e CMN atualizam política de segurança e critérios de tecnologia para o Sistema Financeiro Nacional; medidas já estão...

Ataques a agentes de IA disparam em 2025, aponta pesquisa

Compartilhar:

Destaques

A IA ganhou corpo e o mundo vai sentir o impacto

Carnaval impulsiona nova onda de fraudes com Pix, deepfakes e engenharia social, alerta consultoria

CISOs defendem foco no fator humano para proteger acessos e identidades

Falta cultura de segurança quando o assunto é IA generativa?

IA impulsiona recorde de ciberataques globais, indica estudo

Adequação dos requisitos de SI no Bacen: O que esperar para o futuro?

Colunas & Blogs

Conteúdos Relacionados

Carnaval impulsiona nova onda de fraudes com Pix, deepfakes e engenharia social, alerta consultoria

Falta cultura de segurança quando o assunto é IA generativa?

IA impulsiona recorde de ciberataques globais, indica estudo

Adequação dos requisitos de SI no Bacen: O que esperar para o futuro?