Quando l'efficienza distrugge interi mercati

Quando l'efficienza distrugge interi mercati

Google ha appena annunciato un algoritmo che comprime modelli di IA con un'efficienza senza precedenti. Il mercato delle memorie ha risposto affondando.

Andrés MolinaAndrés Molina26 marzo 20266 min
Condividi

Quando l'efficienza distrugge interi mercati

Martedì scorso, il team di ricerca di Google ha pubblicato sul proprio blog ufficiale i dettagli di TurboQuant, un insieme di algoritmi di quantizzazione avanzata progettato per comprimere in modo massiccio i modelli di linguaggio di grande scala. Il giorno dopo, le azioni di Micron Technology e SanDisk sono crollate. Il meccanismo è stato immediato e la logica, apparentemente lineare: se i modelli di IA necessitano di meno memoria per operare, le aziende che vendono memoria vendono meno. Fine della storia.

Ma quella lettura superficiale nasconde qualcosa di più inquietante per qualsiasi leader che stia basando la propria roadmap su un'infrastruttura che considera lo status quo tecnologico come un terreno solido.

La paura che muove i mercati prima dei dati

La prima cosa da comprendere è che il mercato non ha reagito a risultati finanziari. Ha reagito a una promessa tecnica pubblicata su un blog. Non ci sono stati contratti cancellati, non ci sono state cifre di adozione, non c'è stato alcun cliente Fortune 500 che ha annunciato una riduzione della propria spesa in hardware. C’è stata, invece, una segnale sufficiente per attivare la paura negli investitori: la possibilità che il futuro che giustificava le loro posizioni non sia più così certo.

Questo non è irrazionalità di mercato. È il meccanismo comportamentale più prevedibile che esista: l'anticipazione della perdita pesa più della perdita stessa. Gli investitori istituzionali non aspettano di vedere se TurboQuant viene implementato su larga scala, né se effettivamente riduce gli ordini di hardware dai grandi centri di calcolo. Escono prima. L'abitudine di presumere che più IA significasse sempre maggiore richiesta di hardware ha appena subito il suo primo colpo diretto, e questo è sufficiente.

Per i produttori di memoria, questo è il tipo di notizia che non si gestisce con un comunicato stampa. Si gestisce comprendendo che la minaccia non risiede nel prodotto di Google, ma nella testa dei loro stessi clienti e investitori, già impegnati a ricalcolare.

L'attrito che nessuno sta misurando nella catena di adozione

Qui l'analisi diventa più interessante, e più scomoda per gli ottimisti tecnologici.

TurboQuant, come qualsiasi architettura di efficienza, non si adotta semplicemente pubblicando un documento. Gli ingegneri dei grandi laboratori di IA devono riprenotare i loro flussi di lavoro, verificare che la compressione non degradi le prestazioni nei loro casi d'uso specifici, negoziare con i loro team infrastrutturali e, infine, convincere i loro leader che il risparmio sull'hardware giustifica il costo della migrazione. Ciascuno di questi passaggi è attrito cognitivo e operativo accumulato.

La storia della tecnologia è piena di algoritmi di efficienza che promettevano di ridurre i costi dell'infrastruttura e che hanno impiegato tra i cinque e i dieci anni per passare dai documenti alla produzione di massa. La virtualizzazione, il cloud computing, i modelli di inferenza distribuita: tutti hanno attraversato un lungo periodo di coesistenza con l'infrastruttura che avrebbero dovuto sostituire.

L'abitudine organizzativa è, probabilmente, la forza più sottovalutata dagli analisti che seguono la tecnologia. Le aziende che oggi consumano memoria su scala industriale hanno processi, fornitori e budget approvati. Cambiare ciò non richiede solo una soluzione tecnica migliore; richiede che qualcuno all’interno di queste organizzazioni assuma il costo politico di dire "la nostra attuale infrastruttura è inefficiente" e che quella persona abbia il capitale interno per forzarlo. Questa persona raramente esiste nei primi mesi dopo un annuncio.

Ciò che questo significa per Micron e SanDisk non è che il loro business collasserà domani. Significa che hanno una finestra, probabilmente di due o quattro anni, per riposizionarsi prima che l'attrito dell'adozione ceda e TurboQuant, o i suoi discendenti, arrivino alla produzione su grande scala.

La trappola del prodotto brillante in un mercato spaventato

C'è un modello che si ripete con una regolarità preoccupante nell'industria tecnologica: quando un'azienda affronta una minaccia di sostituzione, la sua risposta istintiva è investire per far brillare di più il proprio prodotto attuale. Miglioramenti incrementali, campagne di posizionamento, roadmap con più gigabyte, maggiore velocità, maggiore densità di memorizzazione.

Ciò è esattamente ciò che non serve a un cliente che sta già valutando se ha bisogno di meno di quanto acquista.

L'impulso generato da TurboQuant nei clienti di Micron e SanDisk non è tecnico, è finanziario e strategico. Un CTO che legge l'annuncio di Google non pensa prima alla complessità della migrazione; pensa all'argomento che dovrà presentare al suo CFO quando spiega perché continua a comprare la stessa quantità di hardware dell'anno scorso. Quel momento, quell'istante di disagio di bilancio, è dove l'attrito cambia schieramento: smette di stare dalla parte della nuova tecnologia e inizia a stare dalla parte del fornitore consolidato.

I produttori di hardware che sopravvivranno a questa transizione non saranno quelli con il miglior prodotto. Saranno quelli che capiranno che il loro prossimo cliente più importante non è l'ingegnere che valuta specifiche tecniche, ma il CFO che cerca una giustificazione per non cambiare nulla. Spegnere quella paura del cambiamento disordinato, garantire compatibilità, offrire visibilità sui costi a tre anni, costruire l'argomento del perché la transizione graduale sia più costosa della stabilità attuale: ecco cosa muove una decisione di acquisto in un mercato spaventato.

L'efficienza di Google è reale. L'attrito dell'adozione è reale. E tra questi due poli vive il business di qualsiasi azienda consolidata che desideri rimanere rilevante quando la polvere si sarà posata.

I leader che oggi stanno costruendo la loro strategia di prodotto esclusivamente sulle virtù di ciò che offrono, senza mappare con la stessa precisione le paure che paralizzano i loro acquirenti, stanno commettendo l'errore più costoso della pianificazione strategica: presumere che un prodotto superiore si venda da solo, quando il mercato ha dimostrato, sistematicamente, che ciò che blocca un acquisto non è mai la mancanza di qualità del prodotto, ma la presenza di un'attrito che nessuno si è preso la briga di spegnere.

Condividi
0 voti
Vota per questo articolo!

Commenti

...

Potrebbe interessarti anche