Tokens sin control: la crisis presupuestaria de la IA empresarial

Cien mil millones de tokens y ningún CFO sabe qué compró

Sam Altman subió al escenario del evento empresarial de OpenAI el 2 de junio de 2026 con una estadística diseñada para impresionar: el mayor consumidor interno de tokens de su compañía procesa alrededor de 100 mil millones de tokens al mes. La sala reaccionó como se esperaba. Luego Altman agregó, casi de pasada, que ese número no es el récord mundial, porque alguien fuera de OpenAI consume incluso más. Y ahí, sin proponérselo del todo, describió con precisión el problema que está fracturando la economía de la inteligencia artificial a escala corporativa: el consumo creció tan rápido que superó tanto la imaginación de quienes venden el producto como la capacidad de presupuestación de quienes lo compran.

Lo que vino después del dato fue más revelador que el dato mismo. Altman admitió que los costos son ahora la segunda queja más frecuente de los clientes empresariales de OpenAI. Y describió un meme que circula entre ejecutivos corporativos con más precisión diagnóstica que cualquier reporte de analistas: "La empresa gastó todo el presupuesto 2026 en el primer trimestre. ¿Pueden hacerlo más eficiente?" La pregunta dentro del meme no es retórica. Es el nuevo estado de situación de decenas de organizaciones que entraron al año con supuestos de gasto basados en patrones de 2025 y se encontraron con que los modelos agénticos consumen a una velocidad diferente.

Hace seis años y medio, el usuario más activo de OpenAI procesaba aproximadamente 100,000 tokens al mes. Hoy, esa cifra es el promedio mundial por persona. El usuario interno más activo de la compañía consume un millón de veces más que aquel récord histórico. Altman proyecta que esa expansión se repetirá. Si lo hace, la infraestructura de inteligencia artificial que existe hoy sería al mercado futuro lo que una calculadora de bolsillo a un centro de datos. Pero entre esa proyección y la realidad operativa de los compradores corporativos hay una brecha que ninguna diapositiva de crecimiento exponencial resuelve sola.

El presupuesto como primer indicador de madurez tecnológica

Hay un patrón en la historia de la tecnología empresarial que se repite con suficiente consistencia como para usarlo como marco: cada vez que una tecnología pasa de herramienta experimental a gasto operativo de línea, el departamento financiero entra a la conversación y cambia las reglas. Con el software en la nube pasó a mediados de la década del 2010. Con los datos y la analítica avanzada, pasó después. Con la inteligencia artificial agéntica, está pasando ahora, en 2026, con una velocidad que tomó desprevenidos a los propios ejecutivos de las empresas más sofisticadas del planeta.

Uber es el caso más documentado. Según lo reportado, la compañía agotó su presupuesto de inteligencia artificial para todo 2026 en cuatro meses. La respuesta operativa fue inmediata: un tope de 1,500 dólares mensuales por empleado para herramientas de programación agéntica, incluyendo Claude Code y Cursor. Pero la declaración más significativa no vino del CEO sino del COO, Andrew Macdonald, quien dijo públicamente que Uber no puede trazar una línea directa entre ese gasto creciente en tokens y mejoras concretas para los usuarios finales, ni para conductores ni para pasajeros. Esa frase es, en términos de arquitectura de valor, una señal de alarma de primer orden. No porque el gasto sea malo, sino porque indica que el ciclo de retroalimentación entre inversión y resultado todavía no está cerrado.

Microsoft canceló la mayoría de sus licencias internas de Claude Code antes de mediados de mayo y redirigió a sus ingenieros hacia GitHub Copilot CLI antes del cierre del año fiscal el 30 de junio. La lectura superficial es que Microsoft prefiere su propio producto. La lectura más precisa es que Microsoft también enfrentó desbordamiento presupuestario en herramientas de inteligencia artificial y eligió consolidar el gasto dentro de su propio perímetro antes de que el problema escalara. Amazon eliminó su tabla de clasificación interna de consumo de tokens después de que un ejecutivo senior instruyera al equipo a dejar de usar inteligencia artificial por el simple hecho de usarla. Walmart, que había ofrecido tokens ilimitados a sus empleados para el agente de inteligencia artificial interno, también impuso límites.

El patrón no es coincidencia ni pánico financiero aislado. Es la señal de que el sector corporativo acaba de cruzar el umbral donde la inteligencia artificial dejó de ser un proyecto piloto con presupuesto de innovación y se convirtió en un gasto operativo que compite con otros gastos operativos por justificación de retorno.

Lo que el consumo de tokens revela sobre la distribución del valor

Detrás de los números de consumo hay una estructura económica que merece examinarse con precisión. Cada token consumido es ingreso para OpenAI o para Anthropic, demanda de cómputo para los proveedores de nube y justificación de inversión en infraestructura de chips. Desde ese ángulo, el crecimiento de un millón de veces en seis años y medio es exactamente la narrativa que sostiene las valoraciones de las empresas de infraestructura y la lógica de los grandes contratos de centros de datos.

Pero esa misma estructura tiene una distribución asimétrica que los números de consumo no capturan. Las empresas que pagan los tokens, Uber, Microsoft, Amazon, Walmart, están asumiendo los costos operativos del crecimiento mientras que la captura de valor en términos de márgenes, propiedad intelectual sobre los modelos y poder de fijación de precios se concentra en los proveedores de modelos. Esa asimetría no es necesariamente injusta en términos de mercado, pero sí tiene consecuencias estructurales para la sostenibilidad del modelo de adopción masiva.

Cuando el COO de Uber dice que no puede conectar el gasto en tokens con mejoras de producto, está describiendo un problema de retorno sobre inversión que, si persiste, no se resuelve con más tokens sino con una renegociación de la arquitectura completa del gasto. El hecho de que Anthropic haya superado a OpenAI en gasto corporativo empresarial, según el propio Altman, añade otra capa a este análisis. Significa que la competencia entre modelos está generando una proliferación de plataformas que los equipos de ingeniería adoptan en paralelo, lo cual multiplica los costos sin necesariamente multiplicar los resultados. La consolidación que Microsoft está ejecutando internamente, forzar el uso de una sola herramienta, es una respuesta racional a ese problema, aunque venga envuelta en retórica de preferencia de producto.

El caso de Peter Steinberger, desarrollador externo que según los reportes consumió 603 mil millones de tokens en 30 días, y el empleado de OpenAI que habría usado 210 mil millones de tokens en una sola semana, ilustra algo diferente pero relacionado. Cuando el consumo individual supera en varios órdenes de magnitud el promedio global, el modelo de precios planos o semicerrados empieza a generar subsidios cruzados que no aparecen en ningún balance pero que distorsionan la economía del servicio. No todos los tokens tienen el mismo costo de producción ni el mismo valor para quien los consume.

La cuenta que no cierra en el modelo de adopción masiva

La narrativa dominante en el sector desde 2023 fue la de adopción sin fricción: dar acceso amplio, eliminar barreras de precio, escalar el consumo y capturar valor más tarde a través de dependencia, datos y efectos de red. Ese manual funcionó para construir bases de usuarios masivas. El problema es que en el segmento empresarial, la "dependencia" tiene un contrapeso que en el consumidor individual no existe con la misma intensidad: un CFO y un ciclo presupuestario anual.

Altman describió el cambio de actitud como algo que llegó "de repente". A principios de 2026, según sus propias palabras, a nadie le importaban los costos. Todos estaban conformes con su nivel de gasto. Esa descripción, dicha por el CEO de la empresa más valiosa del sector de inteligencia artificial, es en sí misma un diagnóstico de cómo se estructuró la etapa de adopción: sin que los compradores tuvieran claridad sobre la curva de costos que estaban aceptando implícitamente al escalar el uso agéntico.

Los modelos agénticos, a diferencia de los chatbots de consulta puntual, tienen una característica que los hace estructuralmente costosos a escala: ejecutan tareas en cadena, lo que significa que cada paso del proceso consume tokens, incluyendo los pasos intermedios de razonamiento, verificación y corrección de errores. Una tarea que un humano resuelve con una decisión puede requerir decenas de llamadas al modelo antes de producir un resultado. Ese multiplicador no era evidente en los pilotos con uso moderado. Se volvió visible cuando las empresas desplegaron estas herramientas a escala de cientos o miles de empleados simultáneamente.

El resultado es una brecha entre el valor percibido durante la etapa experimental y el costo real durante la etapa operativa. Y esa brecha no se cierra con mejoras de eficiencia marginal. Requiere o bien modelos de precios radicalmente distintos, o bien una revisión profunda de qué tareas merecen resolverse con agentes de inteligencia artificial y cuáles se resuelven más barato con procesos más simples.

El siguiente ciclo no lo gana quien vende más tokens

La conclusión más directa que emerge de las declaraciones de Altman y del comportamiento simultáneo de las empresas más grandes del mundo es que el sector de inteligencia artificial empresarial está entrando a su segunda fase. La primera fase fue de adopción por entusiasmo, con presupuestos de innovación y tolerancia alta a la incertidumbre sobre el retorno. La segunda fase es de adopción por justificación, donde el gasto en inteligencia artificial compite en la misma mesa que el gasto en infraestructura, personal y operaciones, y necesita demostrar el mismo tipo de retorno medible.

Esa transición no es negativa para el sector. Pero sí cambia quién gana dentro de él. En la primera fase ganaron los que ofrecían el modelo más capaz y la experiencia más fluida. En la segunda fase ganarán los que puedan demostrar con precisión cuánto cuesta cada resultado y cuánto vale. Eso favorece a los proveedores que desarrollen herramientas de observabilidad, control de costos y atribución de resultados, no solo a los que escalen la capacidad bruta del modelo.

Altman proyecta otro crecimiento de un millón de veces en consumo de tokens. Si ese crecimiento se materializa sin que la estructura de costos se vuelva más transparente y controlable para los compradores, lo que ocurrirá no será una expansión sostenida del mercado sino una serie de correcciones presupuestarias que fragmentarán la adopción. El meme corporativo que él mismo citó, el presupuesto anual consumido en el primer trimestre, no es una anécdota simpática. Es la descripción precisa del límite estructural del modelo actual de monetización por volumen de tokens, que crece en ingresos para los vendedores exactamente en la proporción en que genera presión insostenible para los compradores.

La arquitectura que permita que ambas curvas coexistan sin que una cancele a la otra todavía no existe con claridad. Mientras no exista, cada récord de consumo de tokens será simultáneamente una buena noticia para la infraestructura y una señal de alerta para la continuidad del gasto corporativo que la financia.