Il punto cieco dell'IA nei report aziendali

Il punto cieco di cui nessun dirigente parla nei propri report sull'IA

L'immagine ufficiale dell'adozione aziendale dell'intelligenza artificiale appare ordinata: investimenti approvati, progetti pilota in corso, dashboard con metriche di produttività. Ma c'è uno strato che quei report non riescono a catturare, ed è esattamente lì che si accumula il rischio reale.

Il Ciclo di Hype di Gartner colloca oggi l'IA generativa nel "Abisso della Disillusione", la terza delle cinque fasi in cui le aspettative cominciano a essere misurate rispetto a risultati concreti. È un momento di resa dei conti. E i numeri che stanno emergendo non sono confortanti: uno studio del MIT che circola ampiamente negli ambienti tecnologici conclude che il 95% dei pilota di IA generativa nelle aziende sta fallendo. Non fallendo in modo spettacolare, ma semplicemente senza produrre nulla di misurabile.

Ciò che quel numero nasconde è più interessante del numero stesso. Non si tratta di un problema di tecnologia. È un problema di struttura organizzativa, di visibilità e, in fondo, di come le aziende stanno gestendo qualcosa che si muove più velocemente di quanto riescano a osservare.

Quando l'adozione supera la capacità di osservazione

L'adozione dell'IA nelle grandi organizzazioni ha seguito due percorsi simultanei: il mandato esecutivo dall'alto verso il basso, e l'uso spontaneo di strumenti da parte dei team operativi dal basso verso l'alto. Entrambi i percorsi avanzano senza una mappa condivisa.

Il risultato è un inventario frammentato. Diverse unità aziendali utilizzano strumenti diversi per compiti simili, con livelli di supervisione che vanno dal controllo rigoroso alla completa informalità. Questo non è un dato secondario. Ogni interazione con un sistema di IA genera un registro comportamentale: cosa gli viene chiesto, quali dati vengono condivisi, quali flussi di lavoro attiva. Queste informazioni esistono, ma nella maggior parte dei casi non vengono acquisite in modo sistematico né analizzate.

Il problema non è che le organizzazioni utilizzino l'IA in modo decentralizzato. Il problema è che i leader operano sulla base di supposizioni su tale utilizzo che non hanno alcun fondamento empirico. Credono di sapere quali strumenti sono attivi, quali dati circolano attraverso di essi e in quali condizioni. In pratica, quella conoscenza è parziale e frequentemente superata.

ISACA, nella sua analisi dei rischi per il 2026, descrive questo con precisione: esiste un punto cieco nel cuore del rischio aziendale legato all'IA, e non si tratta di un problema di capacità dei modelli, bensì di controllo sul loro utilizzo. La fragilità non risiede in ciò che i modelli possono fare male. Risiede nel fatto che le organizzazioni non hanno una visibilità sufficiente per sapere cosa sta accadendo a livello di ogni singola interazione.

Quando la visibilità è bassa, il rischio assume più forme contemporaneamente. Vi è esposizione di dati sensibili attraverso strumenti non autorizzati. Vi sono agenti di IA con accessi che non sono mai stati formalmente verificati. Vi sono decisioni automatizzate che nessuno ha sottoposto ad audit dopo l'approvazione del pilota iniziale. E vi è, soprattutto, un divario crescente tra ciò che i leader riportano verso l'alto riguardo alle prestazioni delle loro iniziative di IA e ciò che sta accadendo nelle operazioni quotidiane.

Ciò che la ricerca sulla sicurezza rivela sui modelli in uso

La discussione sui punti ciechi ha una dimensione tecnica che tende a restare fuori dalle conversazioni nei consigli di amministrazione. Le valutazioni della sicurezza dei modelli linguistici hanno modificato la loro metodologia, e i risultati sono scomodi per i team che hanno approvato implementazioni basandosi su benchmark standard.

La distinzione critica è tra test a turno singolo e test a turni multipli. Nei primi, si valuta se un modello rifiuta un'istruzione problematica in una singola interazione. Nei secondi, viene simulata una conversazione iterativa in cui l'attaccante adatta la propria strategia dopo ogni risposta. I risultati divergono in modo significativo.

Ricerche citate da National CIO Review mostrano che nei modelli dei principali fornitori, i tassi di successo degli attacchi conversazionali oscillano tra il 7,89% e l'88,30%, a seconda del modello e del tipo di attacco. Non si tratta di rumore statistico: è un intervallo che dovrebbe cambiare il modo in cui le organizzazioni pensano alla robustezza dei sistemi che hanno già distribuito.

L'implicazione pratica è diretta. Le organizzazioni che hanno approvato implementazioni basandosi su test di sicurezza a turno singolo hanno una visione del rischio che sottovaluta ciò che accade in condizioni di utilizzo prolungato o sotto pressione avversariale. E le organizzazioni che non hanno effettuato alcun test formale prima del dispiegamento hanno un divario ancora maggiore tra la fiducia dichiarata e la loro esposizione reale.

Il problema non si esaurisce nella sicurezza del modello. Quando si parla di agenti di IA, il perimetro del rischio si espande. Un agente non si limita a rispondere a domande: agisce. Può accedere a sistemi interni, eseguire processi, prendere decisioni delegate. Questo lo trasforma in un'identità operativa all'interno dell'organizzazione, con tutti i rischi che ciò comporta: accessi che non sono mai stati revocati, autorizzazioni concesse durante un pilota e mai ridimensionate, e attività che non sono registrate in nessun log che qualcuno esamini regolarmente.

TechRadar Pro lo formula in un modo che merita attenzione in qualsiasi riunione dedicata al rischio operativo: il problema non è l'IA, è il l'accesso che le è stato concesso. Le organizzazioni che riportano tassi di incidenti significativamente più bassi sono quelle che hanno implementato controlli di privilegio minimo sui propri agenti, quelle che li trattano come identità formali che richiedono provisioning, revisione periodica e revoca.

La spesa in IA che non riesce a rendere conto di se stessa

C'è una dimensione finanziaria in questo problema che le discussioni sulla governance dell'IA solitamente eludono. Se un'organizzazione non riesce a osservare come viene utilizzato il proprio investimento in IA, non può nemmeno misurarne il rendimento in modo affidabile.

Questo ha conseguenze concrete. I budget per l'IA vengono approvati sulla base di proiezioni di produttività che, in molti casi, sono state costruite su pilota controllati che non rappresentano le condizioni dell'utilizzo su larga scala. Quando quell'utilizzo su larga scala arriva, porta con sé strumenti non autorizzati, flussi non supervisionati e comportamenti che nessuno aveva anticipato. La produttività potrebbe anche verificarsi, ma se non vi è visibilità su ciò che la genera e in quali condizioni, il risultato è che i leader non possono replicarla intenzionalmente né scalarla in modo controllato.

Il meccanismo di fragilità in questo caso è specifico: quando la visibilità è bassa, il capitale fluisce verso lo strumento che sa vendersi meglio internamente, non verso quello che genera più valore. I team che utilizzano l'IA in modi che producono risultati reali ma senza documentazione formale restano fuori dal budget del ciclo successivo. I team con presentazioni più rifinite ottengono risorse aggiuntive anche se le loro metriche sono più deboli.

Non si tratta di un problema di corruzione interna. È un problema di architettura dell'informazione. Senza dati sull'utilizzo reale, i comitati di investimento operano con testimonianze qualitative anziché con pattern osservati. E le testimonianze qualitative sono sistematicamente distorte verso le storie di successo, non verso i fallimenti silenziosi che accumulano costi senza generare valore.

Il rischio di conformità aggrava il quadro. Le normative sull'uso dell'IA nei settori finanziario, sanitario e delle infrastrutture critiche stanno maturando più rapidamente di quanto le organizzazioni si aspettassero. La domanda che i regolatori stanno già ponendo, e a cui molte aziende non sanno rispondere, è semplice: quale modello, con quali dati, in base a quale politica, ha preso quale decisione? L'incapacità di rispondere a questa domanda non è solo un rischio reputazionale. È, nei mercati regolamentati, un rischio per l'autorizzazione operativa.

Il problema strutturale che il ciclo di hype non risolverà da solo

Il modello storico di adozione tecnologica aziendale mostra che il divario tra capacità e governance non si chiude automaticamente con il passare del tempo. Il cloud ha generato shadow IT. Il SaaS ha moltiplicato le identità non gestite. La mobilità aziendale ha aperto superfici di attacco che hanno impiegato anni per essere catalogate. L'IA sta seguendo lo stesso schema, ma con una velocità di propagazione più elevata e con la differenza sostanziale che gli agenti possono agire, non solo archiviare o comunicare.

Ciò che distingue le organizzazioni che riusciranno a catturare valore sostenibile da quelle che assorbiranno costi senza rendimento non è il modello che scelgono né il fornitore che ingaggiano. È la capacità di osservare il proprio utilizzo in modo sistematico, di trattare i dati di interazione come segnale operativo e di costruire controlli su quella osservazione prima che il problema diventi visibile esternamente.

Le organizzazioni che stanno risolvendo questo problema con efficacia stanno facendo tre cose concrete. Prima di tutto, stanno catalogando i propri asset di IA come farebbero con qualsiasi asset software aziendale: inventario, versioni, accessi, proprietari. In secondo luogo, stanno implementando il logging delle attività a livello di interazione per i sistemi critici, non come sorveglianza dei dipendenti, ma come base empirica per le decisioni di investimento e la gestione dei rischi. In terzo luogo, stanno rivedendo periodicamente le autorizzazioni concesse agli agenti di IA con lo stesso rigore con cui esaminano gli accessi umani.

Nessuna di queste tre cose richiede una tecnologia che non esiste già. Richiedono la volontà organizzativa di riconoscere che il problema non riguarda solo l'IT, e che la soluzione non può essere delegata esclusivamente ai team tecnici. Il punto cieco di cui nessuno parla nelle presentazioni ai consigli di amministrazione è esattamente questo: la distanza tra ciò che i leader credono di sapere sul proprio utilizzo dell'IA e ciò che accade realmente a livello di ogni singola interazione è un divario informativo con conseguenze operative, finanziarie e regolamentari che si accumulano silenziosamente.

La fragilità in questo ciclo non risiede nei modelli. Risiede nell'architettura di osservazione di chi li distribuisce. Le organizzazioni che lo comprenderanno prima che sia il regolatore o un incidente a renderlo evidente avranno un vantaggio strutturale rispetto a quelle che lo impareranno in modo reattivo.