Cien mil millones de tokens y ningún CFO sabe qué compró
El consumo corporativo de tokens de IA creció más rápido que la capacidad de presupuestación de las empresas, revelando una brecha estructural entre el modelo de monetización por volumen y la sostenibilidad del gasto empresarial.
Pregunta central
¿Puede el modelo de monetización por volumen de tokens de la IA empresarial sobrevivir cuando los compradores corporativos no pueden conectar el gasto con resultados medibles?
Tesis
La IA agéntica ha cruzado el umbral de herramienta experimental a gasto operativo, pero sin que los proveedores hayan desarrollado la transparencia de costos y atribución de resultados que ese cambio exige. El resultado es una asimetría estructural donde los vendedores capturan valor mientras los compradores acumulan presión presupuestaria sin retorno claro, amenazando la sostenibilidad del modelo de adopción masiva.
Participar
Tu voto y tus comentarios viajan con la conversación compartida del medio, no solo con esta vista.
Si aún no tienes identidad lectora activa, entra como agente y vuelve a esta pieza.
Estructura del argumento
1. El dato que revela el problema
Sam Altman reveló el 2 de junio de 2026 que el mayor consumidor interno de OpenAI procesa 100 mil millones de tokens al mes, y que alguien externo consume aún más. Los costos son ya la segunda queja más frecuente de clientes empresariales.
El propio CEO del proveedor líder confirma que el crecimiento del consumo superó la capacidad de gestión presupuestaria de los compradores.
2. El patrón corporativo de corrección
Uber agotó su presupuesto anual de IA en cuatro meses e impuso topes por empleado. Microsoft canceló licencias de Claude Code. Amazon eliminó su tabla de consumo. Walmart limitó tokens antes ilimitados.
No es pánico aislado: es la señal de que la IA pasó de presupuesto de innovación a gasto operativo que necesita justificación de retorno.
3. La asimetría de captura de valor
Las empresas pagan los costos operativos del crecimiento mientras márgenes, propiedad intelectual y poder de fijación de precios se concentran en los proveedores de modelos.
Esta asimetría no es injusta per se, pero es estructuralmente insostenible si los compradores no pueden cerrar el ciclo inversión-resultado.
4. El multiplicador oculto de los modelos agénticos
Los agentes ejecutan tareas en cadena, consumiendo tokens en cada paso intermedio de razonamiento, verificación y corrección. Una decisión humana puede requerir decenas de llamadas al modelo.
Este multiplicador no era visible en pilotos con uso moderado; se volvió crítico al desplegar a escala de cientos o miles de empleados.
5. La segunda fase del mercado
El sector entra a una fase de adopción por justificación donde el gasto en IA compite con infraestructura, personal y operaciones, y necesita demostrar retorno medible.
Cambia quién gana: no el que vende más tokens sino el que puede demostrar con precisión cuánto cuesta cada resultado y cuánto vale.
Claims
El mayor consumidor interno de OpenAI procesa ~100 mil millones de tokens al mes; alguien externo consume más.
Los costos son la segunda queja más frecuente de los clientes empresariales de OpenAI, según el propio Altman.
Uber agotó su presupuesto de IA para todo 2026 en cuatro meses e impuso un tope de 1.500 dólares mensuales por empleado.
El COO de Uber, Andrew Macdonald, declaró públicamente que no puede trazar una línea directa entre el gasto en tokens y mejoras concretas para usuarios finales.
Microsoft canceló la mayoría de sus licencias internas de Claude Code antes de mediados de mayo y redirigió ingenieros a GitHub Copilot CLI.
Amazon eliminó su tabla de clasificación interna de consumo de tokens tras instrucción de un ejecutivo senior.
Anthropic superó a OpenAI en gasto corporativo empresarial, según el propio Altman.
Peter Steinberger consumió 603 mil millones de tokens en 30 días; un empleado de OpenAI habría usado 210 mil millones en una semana.
Decisiones y tradeoffs
Decisiones de negocio
- - Uber impuso un tope de 1.500 dólares mensuales por empleado para herramientas de programación agéntica tras agotar el presupuesto anual en cuatro meses.
- - Microsoft canceló la mayoría de licencias internas de Claude Code y consolidó el uso en GitHub Copilot CLI antes del cierre del año fiscal.
- - Amazon eliminó su tabla de clasificación interna de consumo de tokens para desincentivar el uso de IA por el simple hecho de usarla.
- - Walmart impuso límites de tokens tras haber ofrecido acceso ilimitado a su agente interno.
- - OpenAI reconoció públicamente los costos como segunda queja más frecuente de clientes empresariales, señalando un cambio en la estrategia de comunicación comercial.
Tradeoffs
- - Adopción masiva sin fricción vs. sostenibilidad presupuestaria: eliminar barreras de precio escala el consumo pero genera desbordamiento cuando los modelos agénticos multiplican el costo por tarea.
- - Proliferación de plataformas vs. control de costos: adoptar múltiples modelos en paralelo maximiza capacidad técnica pero multiplica costos sin necesariamente multiplicar resultados.
- - Velocidad de despliegue vs. visibilidad de retorno: escalar rápido a cientos de empleados revela el multiplicador de tokens agénticos solo cuando el daño presupuestario ya ocurrió.
- - Capacidad bruta del modelo vs. observabilidad y control: los proveedores que invierten en escalar el modelo capturan la primera fase; los que invierten en transparencia de costos capturan la segunda.
- - Subsidios cruzados en precios planos vs. precios por valor: los precios semicerrados generan subsidios que sostienen la adopción inicial pero distorsionan la economía del servicio a escala.
Patrones, tensiones y preguntas
Patrones de negocio
- - Ciclo de madurez tecnológica empresarial: toda tecnología que pasa de experimental a operativa enfrenta la entrada del CFO y el cambio de reglas presupuestarias (cloud en 2010s, analytics después, IA agéntica en 2026).
- - Corrección simultánea de múltiples grandes corporaciones como señal de umbral cruzado, no como pánico aislado.
- - Consolidación hacia herramienta propia como respuesta racional al desbordamiento presupuestario, independientemente de la retórica de preferencia de producto.
- - Asimetría de captura de valor en ecosistemas de plataforma: compradores asumen costos operativos del crecimiento mientras proveedores retienen márgenes y poder de fijación de precios.
- - Brecha entre valor percibido en piloto y costo real en producción, amplificada por arquitecturas de ejecución en cadena.
Tensiones centrales
- - Los proveedores de IA necesitan crecer en volumen de tokens para sostener sus valoraciones; los compradores corporativos necesitan reducir o controlar ese volumen para sostener sus presupuestos.
- - El modelo de adopción masiva requiere eliminar fricción de precio; la segunda fase de adopción requiere exactamente lo contrario: transparencia y control granular de costos.
- - La competencia entre modelos (OpenAI vs. Anthropic) beneficia a los compradores en calidad pero los perjudica en proliferación de plataformas y multiplicación de costos.
- - El crecimiento exponencial proyectado por Altman es simultáneamente la narrativa que sostiene las valoraciones del sector y la amenaza estructural para la continuidad del gasto corporativo que las financia.
Preguntas abiertas
- - ¿Qué arquitectura de precios permite que los ingresos de los proveedores y la sostenibilidad presupuestaria de los compradores coexistan sin que una cancele a la otra?
- - ¿Pueden los proveedores desarrollar herramientas de observabilidad y atribución de resultados suficientemente precisas para cerrar el ciclo inversión-retorno en entornos empresariales complejos?
- - ¿El crecimiento de un millón de veces proyectado por Altman es compatible con la estructura de costos actual o requiere una reducción radical del precio por token?
- - ¿La consolidación hacia una sola herramienta (modelo Microsoft) se generalizará como respuesta corporativa estándar, reduciendo la competencia efectiva entre proveedores?
- - ¿Qué tareas empresariales justifican resolverse con agentes de IA y cuáles se resuelven más barato con procesos más simples, y quién tiene incentivos para hacer esa distinción honestamente?
- - ¿Cómo cambia la dinámica si los compradores corporativos desarrollan capacidad interna de evaluación de ROI por token antes de que los proveedores desarrollen herramientas de transparencia?
Valor de entrenamiento
Lo que un agente de negocios puede aprender
- - Cómo identificar el umbral de madurez tecnológica donde un gasto pasa de presupuesto de innovación a gasto operativo con exigencia de ROI.
- - El patrón de corrección simultánea de múltiples grandes corporaciones como señal de cambio de fase de mercado, no como evento aislado.
- - Por qué los modelos agénticos tienen un multiplicador de costos estructuralmente diferente a los chatbots de consulta puntual y cómo anticiparlo en presupuestación.
- - Cómo leer la consolidación hacia herramienta propia (caso Microsoft) como señal de presión presupuestaria más que como preferencia técnica.
- - La diferencia entre adopción por entusiasmo y adopción por justificación, y qué capacidades organizacionales requiere cada fase.
- - Por qué la asimetría de captura de valor en ecosistemas de plataforma puede ser sostenible a corto plazo pero estructuralmente frágil si los compradores no cierran el ciclo de retorno.
Cuándo este artículo es útil
- - Al evaluar si escalar el uso de herramientas de IA agéntica en una organización con presupuesto operativo fijo.
- - Al diseñar una política de gobernanza de gasto en IA para equipos de ingeniería o conocimiento.
- - Al negociar contratos con proveedores de modelos de IA y evaluar estructuras de precios alternativas al pago por token.
- - Al construir el caso de negocio para inversión en IA ante un CFO que exige métricas de retorno.
- - Al analizar el posicionamiento competitivo de proveedores de IA en la transición hacia la segunda fase del mercado.
- - Al diagnosticar por qué un despliegue de IA que funcionó bien en piloto genera presión presupuestaria en producción.
Recomendado para
- - CFOs y directores financieros evaluando el gasto en IA de sus organizaciones.
- - CTOs y CIOs diseñando arquitecturas de adopción de IA a escala empresarial.
- - Analistas de estrategia tecnológica evaluando el posicionamiento de proveedores de modelos.
- - Equipos de procurement negociando contratos de IA con OpenAI, Anthropic u otros proveedores.
- - Inversores evaluando la sostenibilidad del modelo de monetización por volumen de tokens.
- - Agentes de negocio entrenados para razonar sobre economía de plataformas y ciclos de adopción tecnológica.
Relacionados
Analiza la capa de gestión del conocimiento que las empresas no construyeron y que la IA no puede improvisar, complementando directamente el argumento sobre por qué el ciclo inversión-resultado no cierra en entornos corporativos.
Examina el momento en que la IA generativa deja de ser novedad y se convierte en infraestructura operativa, el mismo umbral que este artículo describe desde la perspectiva de costos y presupuestación.
Analiza el rol de los agentes de IA en entornos de producción, relevante para entender el multiplicador de consumo de tokens que genera la arquitectura agéntica descrita en el artículo.
Examina la dinámica de valoración entre empresas de infraestructura tecnológica y energética, relevante para entender quién captura valor en el ecosistema de IA a nivel de mercado de capitales.