El punto ciego de la IA que los ejecutivos no reportan

El punto ciego del que ningún ejecutivo habla en sus reportes de IA

La imagen oficial de la adopción empresarial de inteligencia artificial luce prolija: inversiones aprobadas, proyectos piloto en marcha, dashboards con métricas de productividad. Pero hay una capa que esos reportes no capturan, y es exactamente donde se acumula el riesgo real.

El Ciclo de Hype de Gartner ubica hoy a la IA generativa en el "Valle del Desencanto", la tercera de cinco etapas donde las expectativas empiezan a medirse contra resultados concretos. Es un momento de ajuste de cuentas. Y los números que están saliendo no son cómodos: un estudio del MIT que circula ampliamente en círculos tecnológicos concluye que el 95% de los pilotos de IA generativa en empresas está fallando. No fracasando espectacularmente, sino simplemente no llegando a nada medible.

Lo que ese número esconde es más interesante que el número mismo. No es un problema de tecnología. Es un problema de estructura organizacional, de visibilidad y, en el fondo, de cómo las empresas están gestionando algo que se mueve más rápido de lo que pueden ver.

Cuando la adopción supera la capacidad de observación

La adopción de IA en las grandes organizaciones ha seguido dos caminos simultáneos: el mandato ejecutivo de arriba hacia abajo, y el uso espontáneo de herramientas desde los equipos operativos hacia arriba. Ambos caminos avanzan sin mapa compartido.

El resultado es un inventario fragmentado. Distintas unidades de negocio usan distintas herramientas para tareas similares, con niveles de supervisión que van desde el control estricto hasta la completa informalidad. Esto no es un dato menor. Cada interacción con un sistema de IA genera un registro de comportamiento: qué se le pregunta, qué datos se comparten, qué flujos de trabajo activa. Esa información existe, pero en la mayoría de los casos no se captura de forma sistemática ni se analiza.

El problema no es que las organizaciones usen IA de manera descentralizada. El problema es que los líderes operan bajo supuestos sobre ese uso que no tienen base empírica. Creen saber qué herramientas están activas, qué datos circulan por ellas y bajo qué condiciones. En la práctica, ese conocimiento es parcial y frecuentemente desactualizado.

ISACA, en su análisis de riesgos para 2026, describe esto con precisión: hay un punto ciego en el corazón del riesgo empresarial de IA, y no es un problema de capacidad de los modelos sino de control sobre su uso. La fragilidad no está en lo que los modelos pueden hacer mal. Está en que las organizaciones no tienen suficiente visibilidad para saber qué está pasando en el nivel de cada interacción.

Cuando la visibilidad es baja, el riesgo toma varias formas al mismo tiempo. Hay exposición de datos sensibles a través de herramientas no sancionadas. Hay agentes de IA con accesos que nunca se revisaron formalmente. Hay decisiones automatizadas que nadie auditó después de aprobar el piloto inicial. Y hay, sobre todo, una brecha creciente entre lo que los líderes reportan hacia arriba sobre el rendimiento de sus iniciativas de IA y lo que está ocurriendo en la operación diaria.

Lo que la investigación de seguridad revela sobre los modelos en uso

La discusión sobre puntos ciegos tiene una dimensión técnica que suele quedarse fuera de las conversaciones de directorio. Las evaluaciones de seguridad de modelos de lenguaje han cambiado su metodología, y los resultados son incómodos para los equipos que aprobaron implementaciones basándose en benchmarks estándar.

La distinción crítica está entre pruebas de turno único y pruebas de turnos múltiples. En las primeras, se evalúa si un modelo rechaza una instrucción problemática en una sola interacción. En las segundas, se simula una conversación iterativa donde el atacante ajusta su estrategia después de cada respuesta. Los resultados divergen de manera significativa.

Investigación citada por National CIO Review muestra que en modelos de los principales proveedores, las tasas de éxito de ataques conversacionales oscilan entre el 7,89% y el 88,30%, dependiendo del modelo y del tipo de ataque. Eso no es ruido estadístico: es un rango que debería cambiar cómo las organizaciones piensan en la robustez de los sistemas que ya tienen desplegados.

La implicación práctica es directa. Las organizaciones que aprobaron implementaciones basándose en pruebas de seguridad de turno único tienen una imagen del riesgo que subestima lo que ocurre en condiciones de uso prolongado o bajo presión adversarial. Y las organizaciones que no hicieron ninguna prueba formal antes de desplegar tienen una brecha aún mayor entre su confianza declarada y su exposición real.

El problema no termina en la seguridad del modelo. Cuando se habla de agentes de IA, el perímetro de riesgo se expande. Un agente no solo responde preguntas: actúa. Puede acceder a sistemas internos, ejecutar procesos, tomar decisiones delegadas. Eso lo convierte en una identidad operativa dentro de la organización, con todos los riesgos que eso implica: accesos que nunca se revocaron, permisos que se otorgaron durante un piloto y nunca se redimensionaron, y actividad que no está registrada en ningún log que alguien revise regularmente.

TechRadar Pro lo formula de manera que merece atención en cualquier reunión de riesgo operacional: el problema no es la IA, es el acceso que se le otorgó. Las organizaciones que reportan tasas de incidentes significativamente más bajas son las que implementaron controles de privilegio mínimo sobre sus agentes, las que los tratan como identidades formales que requieren provisión, revisión periódica y revocación.

El gasto en IA que no puede rendir cuentas de sí mismo

Hay una dimensión financiera en este problema que las discusiones sobre gobernanza de IA habitualmente evaden. Si una organización no puede observar cómo se usa su inversión en IA, tampoco puede medir su retorno de manera confiable.

Esto tiene consecuencias concretas. Los presupuestos de IA se aprueban sobre proyecciones de productividad que, en muchos casos, se construyeron sobre pilotos controlados que no representan las condiciones del uso masivo. Cuando ese uso masivo llega, viene con herramientas no sancionadas, flujos no supervisados y comportamientos que nadie anticipó. La productividad puede estar ocurriendo, pero si no hay visibilidad sobre qué la genera y bajo qué condiciones, el resultado es que los líderes no pueden replicarla intencionalmente ni escalarla de manera controlada.

El mecanismo de fragilidad aquí es específico: cuando la visibilidad es baja, el capital fluye hacia la herramienta que mejor se sabe vender internamente, no hacia la que genera más valor. Los equipos que usan IA de maneras que producen resultados reales pero sin documentación formal quedan fuera del presupuesto del siguiente ciclo. Los equipos con presentaciones más pulidas consiguen recursos adicionales aunque sus métricas sean más débiles.

Esto no es un problema de corrupción interna. Es un problema de arquitectura de información. Sin datos sobre uso real, los comités de inversión operan con testimonios cualitativos en lugar de patrones observados. Y los testimonios cualitativos están sistemáticamente sesgados hacia las historias de éxito, no hacia los fracasos silenciosos que acumulan costo sin generar valor.

El riesgo de cumplimiento agrava el cuadro. Las regulaciones sobre uso de IA en sectores financieros, de salud y de infraestructura crítica están madurando más rápido de lo que las organizaciones esperaban. La pregunta que los reguladores ya están haciendo, y que muchas empresas no pueden responder, es simple: ¿cuál modelo, con cuáles datos, bajo cuál política, tomó cuál decisión? La incapacidad de responder esa pregunta no es solo un riesgo reputacional. Es, en mercados regulados, un riesgo de autorización operativa.

El problema estructural que el ciclo de hype no resolverá solo

El patrón histórico de adopción tecnológica empresarial muestra que la brecha entre capacidad y gobernanza no se cierra automáticamente con el tiempo. La nube creó shadow IT. El SaaS multiplicó identidades no gestionadas. La movilidad corporativa abrió superficies de ataque que tardaron años en catalogar. La IA está siguiendo el mismo patrón, pero con una velocidad de propagación más alta y con la diferencia sustancial de que los agentes pueden actuar, no solo almacenar o comunicar.

Lo que separa a las organizaciones que van a capturar valor sostenible de las que van a absorber costos sin retorno no es el modelo que elijan ni el proveedor que contraten. Es la capacidad de observar su propio uso de manera sistemática, de tratar los datos de interacción como señal operacional y de construir controles sobre esa observación antes de que el problema sea visible externamente.

Las organizaciones que están resolviendo esto bien están haciendo tres cosas concretas. Primero, están catalogando sus activos de IA como lo harían con cualquier activo de software empresarial: inventario, versiones, accesos, propietarios. Segundo, están implementando logging de actividad a nivel de interacción para los sistemas críticos, no como vigilancia de empleados sino como base empírica para decisiones de inversión y gestión de riesgos. Tercero, están revisando periódicamente los permisos otorgados a agentes de IA con el mismo rigor con el que revisan los accesos humanos.

Ninguna de estas tres cosas requiere tecnología que no exista. Requieren voluntad organizacional para reconocer que el problema no es solo de TI, y que la solución no puede delegarse exclusivamente a los equipos técnicos. El punto ciego del que nadie habla en las presentaciones de directorio es exactamente ese: la distancia entre lo que los líderes creen que saben sobre su uso de IA y lo que realmente ocurre en el nivel de cada interacción es una brecha de información con consecuencias operacionales, financieras y regulatorias que se acumulan silenciosamente.

La fragilidad en este ciclo no está en los modelos. Está en la arquitectura de observación de quienes los despliegan. Las organizaciones que lo entiendan antes de que el regulador o el incidente lo haga evidente tendrán una ventaja estructural sobre las que lo aprendan de manera reactiva.