O ponto cego que nenhum executivo menciona em seus relatórios de IA
A imagem oficial da adoção empresarial de inteligência artificial parece bem organizada: investimentos aprovados, projetos-piloto em andamento, dashboards com métricas de produtividade. Mas há uma camada que esses relatórios não capturam, e é exatamente onde o risco real se acumula.
O Ciclo de Hype da Gartner posiciona hoje a IA generativa no "Vale do Desencanto", a terceira de cinco etapas, onde as expectativas começam a ser medidas contra resultados concretos. É um momento de acerto de contas. E os números que estão surgindo não são confortáveis: um estudo do MIT que circula amplamente em círculos tecnológicos conclui que 95% dos pilotos de IA generativa em empresas estão falhando. Não fracassando de forma espetacular, mas simplesmente não chegando a nenhum resultado mensurável.
O que esse número esconde é mais interessante do que o número em si. Não se trata de um problema de tecnologia. É um problema de estrutura organizacional, de visibilidade e, no fundo, de como as empresas estão gerenciando algo que se move mais rápido do que conseguem acompanhar.
Quando a adoção supera a capacidade de observação
A adoção de IA nas grandes organizações seguiu dois caminhos simultâneos: o mandato executivo de cima para baixo e o uso espontâneo de ferramentas pelas equipes operacionais de baixo para cima. Ambos os caminhos avançam sem um mapa compartilhado.
O resultado é um inventário fragmentado. Diferentes unidades de negócio utilizam diferentes ferramentas para tarefas semelhantes, com níveis de supervisão que variam desde o controle rigoroso até a completa informalidade. Isso não é um detalhe menor. Cada interação com um sistema de IA gera um registro de comportamento: o que é solicitado, quais dados são compartilhados, quais fluxos de trabalho são ativados. Essa informação existe, mas na maioria dos casos não é capturada de forma sistemática nem analisada.
O problema não é que as organizações usem IA de maneira descentralizada. O problema é que os líderes operam com base em suposições sobre esse uso que não têm fundamento empírico. Acreditam saber quais ferramentas estão ativas, quais dados circulam por elas e em quais condições. Na prática, esse conhecimento é parcial e frequentemente desatualizado.
A ISACA, em sua análise de riscos para 2026, descreve isso com precisão: há um ponto cego no coração do risco empresarial de IA, e não se trata de um problema de capacidade dos modelos, mas de controle sobre seu uso. A fragilidade não está no que os modelos podem fazer de errado. Está no fato de que as organizações não têm visibilidade suficiente para saber o que está acontecendo no nível de cada interação.
Quando a visibilidade é baixa, o risco assume várias formas ao mesmo tempo. Há exposição de dados sensíveis por meio de ferramentas não sancionadas. Há agentes de IA com acessos que nunca foram revisados formalmente. Há decisões automatizadas que ninguém auditou após a aprovação do piloto inicial. E há, sobretudo, uma lacuna crescente entre o que os líderes reportam para cima sobre o desempenho de suas iniciativas de IA e o que está ocorrendo na operação diária.
O que a pesquisa de segurança revela sobre os modelos em uso
A discussão sobre pontos cegos tem uma dimensão técnica que costuma ficar de fora das conversas de diretoria. As avaliações de segurança de modelos de linguagem mudaram sua metodologia, e os resultados são desconfortáveis para as equipes que aprovaram implementações com base em benchmarks padrão.
A distinção crítica está entre testes de turno único e testes de múltiplos turnos. Nos primeiros, avalia-se se um modelo rejeita uma instrução problemática em uma única interação. Nos segundos, simula-se uma conversa iterativa em que o atacante ajusta sua estratégia após cada resposta. Os resultados divergem de maneira significativa.
Pesquisas citadas pela National CIO Review mostram que, em modelos dos principais fornecedores, as taxas de sucesso de ataques conversacionais variam entre 7,89% e 88,30%, dependendo do modelo e do tipo de ataque. Isso não é ruído estatístico: é um intervalo que deveria mudar a forma como as organizações pensam sobre a robustez dos sistemas que já têm implantados.
A implicação prática é direta. As organizações que aprovaram implementações com base em testes de segurança de turno único têm uma visão do risco que subestima o que ocorre em condições de uso prolongado ou sob pressão adversarial. E as organizações que não realizaram nenhum teste formal antes de implantar têm uma lacuna ainda maior entre sua confiança declarada e sua exposição real.
O problema não se limita à segurança do modelo. Quando se fala em agentes de IA, o perímetro de risco se expande. Um agente não apenas responde perguntas: ele age. Pode acessar sistemas internos, executar processos, tomar decisões delegadas. Isso o torna uma identidade operacional dentro da organização, com todos os riscos que isso implica: acessos que nunca foram revogados, permissões concedidas durante um piloto e nunca redimensionadas, e atividade que não está registrada em nenhum log que alguém revise regularmente.
A TechRadar Pro formula isso de uma maneira que merece atenção em qualquer reunião de risco operacional: o problema não é a IA, é o acesso que foi concedido a ela. As organizações que reportam taxas de incidentes significativamente mais baixas são aquelas que implementaram controles de privilégio mínimo sobre seus agentes, que os tratam como identidades formais que exigem provisionamento, revisão periódica e revogação.
O gasto com IA que não consegue prestar contas de si mesmo
Há uma dimensão financeira nesse problema que as discussões sobre governança de IA habitualmente evitam. Se uma organização não consegue observar como sua inversão em IA está sendo utilizada, também não consegue medir seu retorno de forma confiável.
Isso tem consequências concretas. Os orçamentos de IA são aprovados com base em projeções de produtividade que, em muitos casos, foram construídas sobre pilotos controlados que não representam as condições do uso em larga escala. Quando esse uso em escala chega, ele vem acompanhado de ferramentas não sancionadas, fluxos não supervisionados e comportamentos que ninguém antecipou. A produtividade pode estar acontecendo, mas se não há visibilidade sobre o que a gera e em quais condições, o resultado é que os líderes não conseguem replicá-la intencionalmente nem escalá-la de forma controlada.
O mecanismo de fragilidade aqui é específico: quando a visibilidade é baixa, o capital flui para a ferramenta que melhor sabe se vender internamente, não para aquela que gera mais valor. As equipes que usam IA de maneiras que produzem resultados reais, mas sem documentação formal, ficam de fora do orçamento do próximo ciclo. As equipes com apresentações mais elaboradas conseguem recursos adicionais mesmo que suas métricas sejam mais fracas.
Isso não é um problema de corrupção interna. É um problema de arquitetura da informação. Sem dados sobre o uso real, os comitês de investimento operam com depoimentos qualitativos em vez de padrões observados. E os depoimentos qualitativos são sistematicamente enviesados em direção às histórias de sucesso, não aos fracassos silenciosos que acumulam custo sem gerar valor.
O risco de conformidade agrava o quadro. As regulamentações sobre uso de IA nos setores financeiro, de saúde e de infraestrutura crítica estão amadurecendo mais rapidamente do que as organizações esperavam. A pergunta que os reguladores já estão fazendo, e que muitas empresas não conseguem responder, é simples: qual modelo, com quais dados, sob qual política, tomou qual decisão? A incapacidade de responder a essa pergunta não é apenas um risco reputacional. É, em mercados regulados, um risco de autorização operacional.
O problema estrutural que o ciclo de hype não resolverá sozinho
O padrão histórico de adoção tecnológica empresarial mostra que a lacuna entre capacidade e governança não se fecha automaticamente com o tempo. A nuvem criou shadow IT. O SaaS multiplicou identidades não gerenciadas. A mobilidade corporativa abriu superfícies de ataque que levaram anos para ser catalogadas. A IA está seguindo o mesmo padrão, mas com uma velocidade de propagação mais alta e com a diferença substancial de que os agentes podem agir, não apenas armazenar ou comunicar.
O que separa as organizações que vão capturar valor sustentável daquelas que vão absorver custos sem retorno não é o modelo que escolhem nem o fornecedor que contratam. É a capacidade de observar seu próprio uso de forma sistemática, de tratar os dados de interação como sinal operacional e de construir controles sobre essa observação antes que o problema se torne visível externamente.
As organizações que estão resolvendo isso bem estão fazendo três coisas concretas. Primeiro, estão catalogando seus ativos de IA da mesma forma que fariam com qualquer ativo de software empresarial: inventário, versões, acessos, proprietários. Segundo, estão implementando logging de atividade no nível de interação para os sistemas críticos, não como vigilância de funcionários, mas como base empírica para decisões de investimento e gestão de riscos. Terceiro, estão revisando periodicamente as permissões concedidas a agentes de IA com o mesmo rigor com que revisam os acessos humanos.
Nenhuma dessas três coisas exige tecnologia que ainda não existe. Exigem vontade organizacional para reconhecer que o problema não é apenas de TI, e que a solução não pode ser delegada exclusivamente às equipes técnicas. O ponto cego do qual ninguém fala nas apresentações de diretoria é exatamente esse: a distância entre o que os líderes acreditam saber sobre o uso de IA em suas organizações e o que realmente ocorre no nível de cada interação é uma lacuna de informação com consequências operacionais, financeiras e regulatórias que se acumulam silenciosamente.
A fragilidade neste ciclo não está nos modelos. Está na arquitetura de observação de quem os implanta. As organizações que compreenderem isso antes que o regulador ou um incidente o torne evidente terão uma vantagem estrutural sobre aquelas que aprenderem de forma reativa.











