VAST e i $200 milioni scommessi sul 3D generativo cinese

VAST e i $200 milioni scommessi sul 3D generativo cinese

Simon Song aveva 29 anni quando ha chiuso un round da $200 milioni e ha superato la soglia del miliardo di dollari di valutazione. VAST, la sua startup di modelli di intelligenza artificiale per contenuti tridimensionali, è appena diventata un unicorno. L'annuncio arriva appena tre mesi dopo che l'azienda aveva chiuso la sua Serie A con $50 milioni guidata da Alibaba e Hengxu Capital.

Martín SolerMartín Soler3 giugno 20269 min
Condividi

VAST e i 200 milioni di dollari puntati sul 3D generativo cinese

Simon Song aveva 29 anni quando ha chiuso un round da 200 milioni di dollari e ha superato la soglia del miliardo di dollari in valutazione. VAST, la sua startup di modelli di intelligenza artificiale per i contenuti tridimensionali, è appena diventata un unicorno. L'annuncio arriva appena tre mesi dopo che la società aveva chiuso la sua Serie A con 50 milioni di dollari guidata da Alibaba e Hengxu Capital. Il ritmo di quella sequenza — 50 milioni a marzo, 200 milioni a giugno — non è solo un segnale di trazione operativa. È un segnale sul tipo di scommessa che gli investitori stanno facendo in questo momento e sul perché il 3D generativo occupa quel posto.

Song è apparso quest'anno nella lista Forbes 30 Under 30 Asia. Prima di fondare VAST nel 2023, aveva lavorato come assistente del cofondatore di SenseTime ed era stato cofondatore di MiniMax, un'altra azienda di modelli di IA. La sua piattaforma Tripo AI converte testo e immagini in oggetti tridimensionali dettagliati nel giro di pochi secondi. Tra i clienti figurano NetEase, il gigante cinese dei videogiochi, e Sony. La base di utenti ammonta a 20 milioni di persone in tutto il mondo, con una presenza particolare negli Stati Uniti, in Europa e in Giappone. Gli abbonamenti vanno dai 20 ai 140 dollari al mese. I progetti aziendali vengono fatturati separatamente. Con quell'annuncio di finanziamento è arrivato anche il lancio del Progetto Eden: un programma per costruire modelli del mondo, ovvero sistemi di IA capaci di generare ambienti virtuali che più utenti possano esplorare e con cui possano interagire.

Ecco il punto. Ciò che merita attenzione non è il numero in sé, ma la struttura di valore che quel numero rivela — e le tensioni che dall'esterno non si vedono ancora.

Il 3D come infrastruttura, non come prodotto

La generazione di immagini tramite IA è arrivata per prima perché il problema era meno costoso da risolvere: dati abbondanti, output verificabile all'istante, domanda massiccia da parte dei creatori individuali. Il 3D ha impiegato più tempo perché i requisiti computazionali sono superiori, i dati di addestramento più scarsi e la catena di utilizzo più complessa. Trasformare un prompt in testo è una cosa. Trasformarlo in un oggetto tridimensionale navigabile, con proporzioni fisiche coerenti e qualità sufficiente per la produzione in tempo reale, è un altro ordine di difficoltà.

Quella difficoltà è precisamente ciò che rende il segmento attraente per il capitale di crescita. Quando un problema tecnico è genuinamente difficile e la domanda è chiaramente formata, chi lo risolve per primo su scala ha un vantaggio che non si replica in poche settimane. La creazione di asset 3D rappresenta oggi uno dei colli di bottiglia più costosi nella produzione di videogiochi, simulazioni industriali, esperienze di realtà aumentata e gemelli digitali per la manifattura. Uno studio di sviluppo di videogiochi di medie dimensioni può spendere tra il 30% e il 50% del suo budget di produzione esclusivamente in arte e modellazione 3D. Comprimere quel costo con l'IA non è un miglioramento incrementale: è una riconversione della struttura dei costi del business.

Ciò che VAST sta posizionando con Tripo AI è, nella sua logica più profonda, uno strato di infrastruttura per la creazione di contenuti tridimensionali. Non un prodotto di nicchia per designer avanzati, ma una piattaforma che può integrarsi nei flussi di produzione di studi di videogiochi, aziende di design industriale, piattaforme di e-commerce e simulatori di addestramento. Quando una startup conta 20 milioni di utenti e clienti come NetEase e Sony nei primi due o tre anni di esistenza, il segnale è che ha trovato domanda su livelli simultanei: il creatore individuale che paga 20 dollari al mese e la grande azienda che paga per progetto. Questa doppia natura del modello di ricavi è importante perché riduce la dipendenza da un unico canale e distribuisce il rischio di abbandono degli utenti.

Il Progetto Eden alza la posta in una direzione specifica: i modelli del mondo. Fei-Fei Li ha raccolto 1 miliardo di dollari per World Labs in quello stesso segmento all'inizio di quest'anno. La mossa di VAST verso quella stessa direzione, con una scala di capitale inferiore ma con una piattaforma operativa già dispiegata, suggerisce che la società scommette sul fatto che il vantaggio competitivo futuro non sarà solo nella generazione di oggetti 3D, ma nella generazione di ambienti completi e navigabili, il che cambia radicalmente la scala del mercato di riferimento.

Dove si trova il capitale e quali incentivi lo muovono

Gli investitori in questo round includono INCE Capital, Genesis Capital e Primavera Capital Group. Non sono fondi generalisti. Sono attori con una profonda esposizione all'ecosistema tecnologico cinese e con la capacità di accompagnare round di crescita verso la scala. La precedente partecipazione di Alibaba nella Serie A non è decorativa: Alibaba ha un interesse diretto nel fatto che esistano strumenti di generazione di contenuti 3D che possano integrarsi con le sue piattaforme di commercio, i suoi servizi cloud e i suoi progetti di intrattenimento.

Questo solleva una domanda strutturale che vale la pena esaminare con attenzione. Quando un investitore strategico come Alibaba entra in un round iniziale e poi la società chiude un round di follow-up quattro volte più grande, ci sono due possibili letture. La prima è che la trazione è stata talmente chiara che i nuovi investitori finanziari sono entrati con una convinzione indipendente. La seconda è che il sostegno di Alibaba ha funzionato come segnale di legittimità che ha facilitato la chiusura con altri fondi. Entrambe le letture possono essere simultaneamente vere, e la distinzione è importante perché definisce quanto sia autonoma la traiettoria di VAST rispetto ai suoi investitori strategici.

Il dettaglio sulla valutazione è ugualmente rivelatore. Secondo due persone a conoscenza dell'operazione, la valutazione supera il miliardo di dollari; una di esse la colloca vicino agli 1,5 miliardi. Il fatto che VAST non confermi pubblicamente la sua valutazione è una pratica comune nelle startup in fase di crescita, ma riflette anche la preferenza dell'azienda di mantenere flessibilità nel modo in cui si presenta al mercato. Con 250 milioni di dollari accumulati in due round nel corso dello stesso anno, il capitale disponibile per essere impiegato è sostanziale. La società ha annunciato che lo utilizzerà per le assunzioni e per la ricerca e lo sviluppo.

Quella destinazione dei fondi ha una logica chiara: nell'IA generativa, il margine di vantaggio si costruisce sulla qualità del modello e sulla capacità di iterarlo più velocemente dei concorrenti. Assumere team di ricerca di alto livello in Cina è più economico che in Silicon Valley, il che trasforma ogni dollaro in una maggiore densità di talenti. Ma quel vantaggio ha un limite noto: la disponibilità di chip di addestramento avanzati, che in Cina opera sotto le restrizioni all'esportazione imposte dal governo degli Stati Uniti. Come VAST risolve quel collo di bottiglia computazionale senza accesso illimitato alle GPU più potenti del mercato è una variabile che gli investitori conoscono e che il mercato esterno non riesce a leggere con chiarezza.

La fragilità che il successo ancora nasconde

Il modello di ricavi di VAST combina abbonamenti individuali e fatturazione aziendale per progetto. Questo è strutturalmente sano: i ricavi ricorrenti di 20 milioni di utenti generano una base prevedibile, mentre i contratti aziendali con studi come NetEase e Sony apportano volume per operazione. Tuttavia, c'è una tensione di fondo che merita attenzione prima che la narrativa dell'unicorno la oscuri.

Le piattaforme di strumenti per creatori e per aziende vivono in logiche diverse. L'utente individuale paga per un'utilità immediata e cambia strumento quando ne appare uno migliore o più economico. L'azienda paga per l'integrazione, il supporto e la garanzia di continuità, ma negozia anche i prezzi e può sviluppare capacità interne se lo strumento diventa sufficientemente maturo. Ciò che oggi sembra un vantaggio — che la piattaforma serva entrambi i segmenti — può trasformarsi in una tensione di prodotto se le esigenze divergono.

Il segmento aziendale richiede modelli più controllabili, verificabili, integrabili con i pipeline esistenti e con SLA ben definiti. Il segmento dei creatori individuali richiede velocità, semplicità e un prezzo accessibile. Mantenere entrambi su un'unica piattaforma richiede un'architettura di prodotto che non sempre scala in modo pulito. Molte piattaforme software sono fallite proprio in quel punto: crescendo, la complessità di servire due segmenti con logiche diverse consuma risorse di ingegneria e frammenta la proposta di valore fino a renderla vaga.

C'è inoltre una variabile competitiva che la narrativa del round non menziona esplicitamente ma che definisce l'orizzonte del settore. I grandi motori di videogiochi — Unity e Unreal Engine in particolare — stanno investendo attivamente in capacità di generazione procedurale e assistita dall'IA per asset 3D. Se quelle piattaforme, che hanno già un'integrazione nativa nei flussi di produzione degli studi, sviluppano strumenti di generazione 3D paragonabili a Tripo AI, la posizione di VAST come livello indipendente si complica. Non perché VAST sparisca, ma perché lo spazio di negoziazione su dove viene catturato il valore nella catena si ridistribuisce.

Il Progetto Eden è la risposta implicita a quel rischio. Muovendosi verso modelli del mondo completi — ambienti navigabili con logica fisica, più utenti e generazione dinamica — VAST punta a un livello di complessità che i motori di gioco non risolveranno nel breve periodo come funzione nativa. È una scommessa sulla costruzione del problema più difficile prima che la concorrenza arrivi a risolvere quello più facile.

Ciò che 200 milioni di dollari non comprano da soli

La distribuzione del valore in questo modello ha, per ora, una geometria ragionevole. Gli utenti individuali ricevono un'utilità reale a prezzi accessibili. I clienti aziendali ottengono una riduzione dei costi di produzione in un collo di bottiglia genuino. Gli investitori ottengono un'esposizione a un segmento dell'IA con domanda strutturale e trazione dimostrata. VAST cattura ricavi su due livelli e accumula dati di utilizzo che retroalimentano il miglioramento del modello. La logica distributiva, così com'è, non mostra segnali evidenti di estrazione in un'unica direzione.

Ma i 200 milioni di dollari non comprano autonomia sull'ambiente competitivo, accesso garantito all'infrastruttura computazionale sotto restrizioni geopolitiche, né la capacità di mantenere simultaneamente la qualità per il creatore individuale e la robustezza per il cliente aziendale. Non comprano nemmeno tempo indefinito: nei modelli di abbonamento per strumenti di IA, il tasso di abbandono risponde direttamente alla velocità con cui compaiono alternative. Il capitale acquista solo la possibilità di risolvere quei problemi prima che diventino costosi. VAST ha quella possibilità. Se la eseguirà bene, l'unicorno di oggi potrà diventare l'infrastruttura dei contenuti 3D del prossimo decennio. Altrimenti, i 200 milioni di dollari saranno il soffitto, non il trampolino di lancio.

Condividi

Potrebbe interessarti anche