100 miliardi di token: i CFO non sanno cosa comprano

Cento miliardi di token e nessun CFO sa cosa ha comprato

Sam Altman è salito sul palco dell'evento aziendale di OpenAI il 2 giugno 2026 con una statistica pensata per impressionare: il maggiore consumatore interno di token della sua azienda elabora circa 100 miliardi di token al mese. La sala ha reagito come previsto. Poi Altman ha aggiunto, quasi en passant, che quel numero non è il record mondiale, perché qualcuno al di fuori di OpenAI ne consuma ancora di più. E lì, senza volerlo del tutto, ha descritto con precisione il problema che sta fratturando l'economia dell'intelligenza artificiale su scala aziendale: il consumo è cresciuto così velocemente da superare sia l'immaginazione di chi vende il prodotto sia la capacità di pianificazione finanziaria di chi lo acquista.

Ciò che è venuto dopo il dato è stato più rivelatore del dato stesso. Altman ha ammesso che i costi sono oggi la seconda lamentela più frequente dei clienti aziendali di OpenAI. E ha descritto un meme che circola tra i dirigenti aziendali con più precisione diagnostica di qualsiasi report di analisti: "L'azienda ha speso tutto il budget 2026 nel primo trimestre. Riuscite a renderlo più efficiente?" La domanda dentro il meme non è retorica. È il nuovo stato della situazione di decine di organizzazioni che hanno iniziato l'anno con ipotesi di spesa basate sui modelli del 2025 e si sono ritrovate a dover fare i conti con il fatto che i modelli agentici consumano a una velocità completamente diversa.

Sei anni e mezzo fa, l'utente più attivo di OpenAI elaborava circa 100.000 token al mese. Oggi, quella cifra è la media mondiale pro capite. L'utente interno più attivo dell'azienda consuma un milione di volte di più rispetto a quel record storico. Altman prevede che questa espansione si ripeterà. Se così fosse, l'infrastruttura di intelligenza artificiale che esiste oggi sarebbe al mercato futuro ciò che una calcolatrice tascabile è a un centro dati. Ma tra quella proiezione e la realtà operativa degli acquirenti aziendali c'è un divario che nessuna diapositiva sulla crescita esponenziale risolve da sola.

Il budget come primo indicatore di maturità tecnologica

Esiste un pattern nella storia della tecnologia aziendale che si ripete con sufficiente regolarità da poter essere usato come schema interpretativo: ogni volta che una tecnologia passa da strumento sperimentale a spesa operativa di linea, il dipartimento finanziario entra nella conversazione e cambia le regole del gioco. Con il software in cloud è successo a metà degli anni 2010. Con i dati e l'analisi avanzata, è successo dopo. Con l'intelligenza artificiale agentica, sta succedendo adesso, nel 2026, con una velocità che ha colto di sorpresa persino i dirigenti delle aziende più sofisticate del pianeta.

Uber è il caso più documentato. Secondo quanto riportato, l'azienda ha esaurito il proprio budget di intelligenza artificiale per tutto il 2026 in quattro mesi. La risposta operativa è stata immediata: un tetto di 1.500 dollari mensili per dipendente per gli strumenti di programmazione agentica, inclusi Claude Code e Cursor. Ma la dichiarazione più significativa non è venuta dal CEO bensì dal COO, Andrew Macdonald, che ha affermato pubblicamente che Uber non riesce a tracciare una linea diretta tra quella spesa crescente in token e miglioramenti concreti per gli utenti finali, né per i conducenti né per i passeggeri. Quella frase è, in termini di architettura del valore, un segnale d'allarme di prim'ordine. Non perché la spesa sia sbagliata, ma perché indica che il ciclo di retroazione tra investimento e risultato non è ancora chiuso.

Microsoft ha cancellato la maggior parte delle proprie licenze interne di Claude Code prima di metà maggio e ha reindirizzato i propri ingegneri verso GitHub Copilot CLI prima della chiusura dell'anno fiscale il 30 giugno. La lettura superficiale è che Microsoft preferisce il proprio prodotto. La lettura più precisa è che Microsoft ha anch'essa affrontato uno sforamento del budget negli strumenti di intelligenza artificiale e ha scelto di consolidare la spesa all'interno del proprio perimetro prima che il problema si aggravasse. Amazon ha eliminato la propria classifica interna di consumo di token dopo che un dirigente senior ha istruito il team a smettere di usare l'intelligenza artificiale semplicemente per il gusto di usarla. Walmart, che aveva offerto token illimitati ai propri dipendenti per l'agente di intelligenza artificiale interno, ha anch'essa imposto dei limiti.

Il pattern non è una coincidenza né un panico finanziario isolato. È il segnale che il settore aziendale ha appena superato la soglia in cui l'intelligenza artificiale ha smesso di essere un progetto pilota con budget di innovazione e si è trasformata in una spesa operativa che compete con altre spese operative per la giustificazione del ritorno sull'investimento.

Cosa rivela il consumo di token sulla distribuzione del valore

Dietro i numeri del consumo si nasconde una struttura economica che merita di essere esaminata con precisione. Ogni token consumato è ricavo per OpenAI o per Anthropic, domanda di calcolo per i fornitori di cloud e giustificazione dell'investimento nell'infrastruttura dei chip. Da questa prospettiva, la crescita di un milione di volte in sei anni e mezzo è esattamente la narrativa che sostiene le valutazioni delle aziende di infrastruttura e la logica dei grandi contratti per i data center.

Ma quella stessa struttura presenta una distribuzione asimmetrica che i numeri del consumo non catturano. Le aziende che pagano i token — Uber, Microsoft, Amazon, Walmart — si stanno assumendo i costi operativi della crescita, mentre la cattura del valore in termini di margini, proprietà intellettuale sui modelli e potere di determinazione dei prezzi si concentra nei fornitori di modelli. Questa asimmetria non è necessariamente ingiusta in termini di mercato, ma ha conseguenze strutturali per la sostenibilità del modello di adozione massiva.

Quando il COO di Uber afferma di non riuscire a collegare la spesa in token ai miglioramenti del prodotto, sta descrivendo un problema di ritorno sull'investimento che, se persiste, non si risolve con più token bensì con una rinegoziazione dell'intera architettura della spesa. Il fatto che Anthropic abbia superato OpenAI nella spesa aziendale aziendale, secondo le stesse parole di Altman, aggiunge un ulteriore livello a questa analisi. Significa che la competizione tra modelli sta generando una proliferazione di piattaforme che i team di ingegneria adottano in parallelo, il che moltiplica i costi senza necessariamente moltiplicare i risultati. Il consolidamento che Microsoft sta attuando internamente — forzare l'uso di un unico strumento — è una risposta razionale a questo problema, anche se avvolta in una retorica di preferenza di prodotto.

Il caso di Peter Steinberger, sviluppatore esterno che secondo le segnalazioni ha consumato 603 miliardi di token in 30 giorni, e il dipendente di OpenAI che avrebbe utilizzato 210 miliardi di token in una sola settimana, illustra qualcosa di diverso ma correlato. Quando il consumo individuale supera di diversi ordini di grandezza la media globale, il modello di prezzi piatti o semi-chiusi inizia a generare sussidi incrociati che non compaiono in nessun bilancio ma che distorcono l'economia del servizio. Non tutti i token hanno lo stesso costo di produzione né lo stesso valore per chi li consuma.

Il conto che non torna nel modello di adozione massiva

La narrativa dominante nel settore dal 2023 è stata quella dell'adozione senza attrito: dare accesso ampio, eliminare le barriere di prezzo, scalare il consumo e catturare il valore in seguito attraverso la dipendenza, i dati e gli effetti di rete. Quel manuale ha funzionato per costruire basi di utenti massicce. Il problema è che nel segmento aziendale, la "dipendenza" ha un contrappeso che nel consumatore individuale non esiste con la stessa intensità: un CFO e un ciclo di budget annuale.

Altman ha descritto il cambiamento di atteggiamento come qualcosa che è arrivato "all'improvviso". All'inizio del 2026, secondo le sue stesse parole, a nessuno importava dei costi. Tutti erano soddisfatti del proprio livello di spesa. Questa descrizione, pronunciata dal CEO dell'azienda più preziosa del settore dell'intelligenza artificiale, è di per sé una diagnosi di come è stata strutturata la fase di adozione: senza che gli acquirenti avessero chiarezza sulla curva dei costi che stavano accettando implicitamente scalando l'utilizzo agentico.

I modelli agentici, a differenza dei chatbot di consultazione puntuale, presentano una caratteristica che li rende strutturalmente costosi su scala: eseguono compiti a catena, il che significa che ogni passaggio del processo consuma token, inclusi i passaggi intermedi di ragionamento, verifica e correzione degli errori. Un compito che un essere umano risolve con una singola decisione può richiedere decine di chiamate al modello prima di produrre un risultato. Quel moltiplicatore non era evidente nei pilota con utilizzo moderato. È diventato visibile quando le aziende hanno distribuito questi strumenti su scala di centinaia o migliaia di dipendenti simultaneamente.

Il risultato è un divario tra il valore percepito durante la fase sperimentale e il costo reale durante la fase operativa. E quel divario non si chiude con miglioramenti di efficienza marginale. Richiede o modelli di prezzo radicalmente diversi, oppure una revisione profonda di quali compiti meritano di essere risolti con agenti di intelligenza artificiale e quali si risolvono più economicamente con processi più semplici.

Il prossimo ciclo non lo vince chi vende più token

La conclusione più diretta che emerge dalle dichiarazioni di Altman e dal comportamento simultaneo delle più grandi aziende del mondo è che il settore dell'intelligenza artificiale aziendale sta entrando nella sua seconda fase. La prima fase è stata quella dell'adozione per entusiasmo, con budget di innovazione e alta tolleranza all'incertezza sul ritorno. La seconda fase è quella dell'adozione per giustificazione, in cui la spesa in intelligenza artificiale compete allo stesso tavolo della spesa in infrastrutture, personale e operazioni, e deve dimostrare lo stesso tipo di ritorno misurabile.

Questa transizione non è negativa per il settore. Ma cambia chi vince al suo interno. Nella prima fase hanno vinto coloro che offrivano il modello più capace e l'esperienza più fluida. Nella seconda fase vinceranno coloro che sapranno dimostrare con precisione quanto costa ogni risultato e quanto vale. Questo favorisce i fornitori che sviluppano strumenti di osservabilità, controllo dei costi e attribuzione dei risultati, non solo quelli che scalano la capacità grezza del modello.

Altman proietta un'ulteriore crescita di un milione di volte nel consumo di token. Se quella crescita si materializza senza che la struttura dei costi diventi più trasparente e controllabile per gli acquirenti, ciò che accadrà non sarà un'espansione sostenuta del mercato bensì una serie di correzioni di bilancio che frammenteranno l'adozione. Il meme aziendale che lui stesso ha citato — il budget annuale consumato nel primo trimestre — non è un aneddoto simpatico. È la descrizione precisa del limite strutturale dell'attuale modello di monetizzazione per volume di token, che cresce in ricavi per i venditori esattamente nella proporzione in cui genera pressione insostenibile per gli acquirenti.

L'architettura che consenta a entrambe le curve di coesistere senza che l'una cancelli l'altra non esiste ancora con chiarezza. Finché non esisterà, ogni record di consumo di token sarà simultaneamente una buona notizia per l'infrastruttura e un segnale d'allarme per la continuità della spesa aziendale che la finanzia.