VAST und die 200 Millionen Dollar, die auf das chinesische generative 3D gesetzt wurden
Simon Song war 29 Jahre alt, als er eine Runde über 200 Millionen Dollar abschloss und die Schwelle von einer Milliarde Dollar Bewertung überschritt. VAST, sein Startup für KI-Modelle zur Erstellung dreidimensionaler Inhalte, ist soeben zum Einhorn geworden. Die Ankündigung kommt nur drei Monate, nachdem das Unternehmen seine Serie A über 50 Millionen Dollar abgeschlossen hatte, angeführt von Alibaba und Hengxu Capital. Das Tempo dieser Abfolge – 50 Millionen Dollar im März, 200 Millionen Dollar im Juni – ist nicht nur ein Signal für operative Dynamik. Es ist ein Signal darüber, welche Art von Wette Investoren in diesem Moment eingehen und warum das generative 3D genau diesen Platz einnimmt.
Song erschien dieses Jahr auf der Forbes-Liste der 30 Under 30 Asia. Bevor er VAST im Jahr 2023 gründete, hatte er als Assistent des Mitgründers von SenseTime gearbeitet und war Mitgründer von MiniMax gewesen, einem weiteren Unternehmen für KI-Modelle. Seine Plattform Tripo AI wandelt Texte und Bilder in Sekunden in detaillierte dreidimensionale Objekte um. Zu den Kunden zählen NetEase, der chinesische Videospielriese, und Sony. Die Nutzerbasis umfasst weltweit 20 Millionen Personen, mit besonderer Präsenz in den Vereinigten Staaten, Europa und Japan. Die Abonnements reichen von 20 bis 140 Dollar monatlich. Unternehmensprojekte werden separat abgerechnet. Mit der Ankündigung der Finanzierungsrunde wurde auch das Projekt Eden ins Leben gerufen: ein Programm zum Aufbau von Weltmodellen, also KI-Systemen, die in der Lage sind, virtuelle Umgebungen zu generieren, die mehrere Nutzer erkunden und in denen sie interagieren können.
Da liegt der Kern der Sache. Was Aufmerksamkeit verdient, ist nicht die Zahl an sich, sondern die Wertstruktur, die diese Zahl offenbart – und die Spannungen, die von außen noch nicht sichtbar sind.
3D als Infrastruktur, nicht als Produkt
Die KI-gestützte Bildgenerierung kam zuerst, weil das Problem günstiger zu lösen war: reichlich vorhandene Daten, sofort überprüfbarer Output, massive Nachfrage seitens einzelner Ersteller. 3D brauchte mehr Zeit, weil die Rechenanforderungen höher sind, die Trainingsdaten spärlicher und die Nutzungskette komplexer. Einen Prompt in Text zu verwandeln ist eine Sache. Ihn in ein navigierbares dreidimensionales Objekt mit kohärenten physikalischen Proportionen und ausreichender Qualität für die Echtzeitproduktion umzuwandeln, ist eine ganz andere Schwierigkeitsstufe.
Genau diese Schwierigkeit macht das Segment für Wachstumskapital attraktiv. Wenn ein technisches Problem tatsächlich schwierig ist und die Nachfrage klar ausgeprägt ist, hat derjenige, der es zuerst in großem Maßstab löst, einen Vorteil, der sich nicht in wenigen Wochen replizieren lässt. Die Erstellung von 3D-Assets stellt heute einen der teuersten Engpässe in der Videospielproduktion, bei industriellen Simulationen, Augmented-Reality-Erlebnissen und digitalen Zwillingen für die Fertigung dar. Ein mittelgroßes Videospiel-Entwicklungsstudio kann zwischen 30 % und 50 % seines Produktionsbudgets allein für Kunst und 3D-Modellierung aufwenden. Diese Kosten mit KI zu komprimieren, ist keine inkrementelle Verbesserung: Es ist eine Umstrukturierung der Ausgabenstruktur des Unternehmens.
Was VAST mit Tripo AI in seiner tiefsten Logik positioniert, ist eine Infrastrukturschicht für die Erstellung dreidimensionaler Inhalte. Kein Nischenprodukt für fortgeschrittene Designer, sondern eine Plattform, die sich in die Produktionsabläufe von Videospielstudios, Unternehmen des Industriedesigns, E-Commerce-Plattformen und Trainingssimulationen integrieren lässt. Wenn ein Startup in den ersten zwei bis drei Jahren seines Bestehens 20 Millionen Nutzer und Kunden wie NetEase und Sony vorweisen kann, ist das Signal klar: Es hat Nachfrage auf mehreren Ebenen gleichzeitig gefunden – beim einzelnen Ersteller, der 20 Dollar im Monat zahlt, und beim Unternehmen, das projektbezogen zahlt. Diese Doppelseite des Einnahmemodells ist wichtig, weil sie die Abhängigkeit von einem einzigen Kanal verringert und das Abwanderungsrisiko verteilt.
Das Projekt Eden erhöht den Einsatz in eine spezifische Richtung: die Weltmodelle. Fei-Fei Li sammelte Anfang dieses Jahres 1 Milliarde Dollar für World Labs in genau diesem Segment. Die Bewegung von VAST in dieselbe Richtung, mit einem geringeren Kapitaleinsatz, aber mit einer bereits eingesetzten operativen Plattform, legt nahe, dass das Unternehmen darauf setzt, dass der zukünftige Wettbewerbsvorteil nicht nur im Erzeugen von 3D-Objekten liegen wird, sondern im Erzeugen von vollständigen und navigierbaren Umgebungen, was die Größenordnung des Zielmarkts grundlegend verändert.
Wo das Kapital liegt und welche Anreize es antreiben
Zu den Investoren dieser Runde gehören INCE Capital, Genesis Capital und Primavera Capital Group. Es handelt sich nicht um Generalisten-Fonds. Es sind Akteure mit tiefer Präsenz im chinesischen Technologie-Ökosystem und mit der Fähigkeit, Wachstumsrunden bis zur Skalierung zu begleiten. Die frühere Beteiligung von Alibaba an der Serie A ist nicht dekorativ: Alibaba hat ein direktes Interesse daran, dass es Werkzeuge zur Generierung von 3D-Inhalten gibt, die sich in seine Handelsplattformen, seine Cloud-Dienste und seine Unterhaltungsprojekte integrieren lassen.
Das wirft eine strukturelle Frage auf, die es sorgfältig zu untersuchen lohnt. Wenn ein strategischer Investor wie Alibaba früh in eine Runde einsteigt und das Unternehmen anschließend eine Folgefinanzierung in vierfacher Höhe abschließt, gibt es zwei mögliche Lesarten. Die erste ist, dass die Dynamik so eindeutig war, dass neue Finanzinvestoren mit unabhängiger Überzeugung eingestiegen sind. Die zweite ist, dass die Unterstützung von Alibaba als Legitimitätssignal fungierte, das den Abschluss mit anderen Fonds erleichterte. Beide Lesarten können gleichzeitig zutreffen, und die Unterscheidung ist wichtig, weil sie definiert, wie eigenständig die Entwicklung von VAST gegenüber seinen strategischen Investoren ist.
Das Detail zur Bewertung ist ebenso aufschlussreich. Laut zwei Personen mit Kenntnis der Transaktion übersteigt die Bewertung eine Milliarde Dollar; eine von ihnen verortet sie bei etwa 1,5 Milliarden Dollar. Die Tatsache, dass VAST seine Bewertung nicht öffentlich bestätigt, ist eine gängige Praxis bei Wachstums-Startups, spiegelt aber auch wider, dass das Unternehmen es vorzieht, Flexibilität in seiner Selbstdarstellung am Markt zu wahren. Mit 250 Millionen Dollar, die in zwei Runden innerhalb desselben Jahres eingesammelt wurden, ist das verfügbare Kapital zum Einsatz erheblich. Das Unternehmen gab bekannt, es für Einstellungen sowie Forschung und Entwicklung zu verwenden.
Dieses Verwendungsziel der Mittel hat eine klare Logik: Im Bereich der generativen KI wird der Vorteil durch die Qualität des Modells und die Fähigkeit aufgebaut, es schneller als die Konkurrenz weiterzuentwickeln. Die Einstellung hochkarätiger Forschungsteams in China ist günstiger als im Silicon Valley, was jeden Dollar in eine höhere Talentdichte verwandelt. Aber dieser Vorteil hat eine bekannte Grenze: die Verfügbarkeit fortschrittlicher Trainings-Chips, die in China unter den von der US-Regierung verhängten Exportbeschränkungen operiert. Wie VAST diesen rechnerischen Engpass löst, ohne uneingeschränkten Zugang zu den leistungsfähigsten GPUs des Marktes, ist eine Variable, die den Investoren bekannt ist und die der externe Markt nicht klar ablesen kann.
Die Fragilität, die der Erfolg noch verbirgt
Das Einnahmemodell von VAST kombiniert individuelle Abonnements und projektbezogene Unternehmensabrechnung. Das ist strukturell gesund: Die wiederkehrenden Einnahmen von 20 Millionen Nutzern schaffen eine vorhersehbare Basis, während Unternehmensverträge mit Studios wie NetEase und Sony ein hohes Volumen pro Transaktion einbringen. Es gibt jedoch eine grundlegende Spannung, die Aufmerksamkeit verdient, bevor sie die Einhorn-Erzählung verdeckt.
Plattformen für Ersteller-Werkzeuge und für Unternehmen leben nach unterschiedlichen Logiken. Der einzelne Nutzer zahlt für unmittelbaren Nutzen und wechselt das Werkzeug, sobald etwas Besseres oder Günstigeres auftaucht. Das Unternehmen zahlt für Integration, Support und Kontinuitätsgarantie, verhandelt aber auch Preise und kann interne Kapazitäten aufbauen, wenn das Werkzeug reif genug wird. Was heute wie ein Vorteil erscheint – dass die Plattform beiden Segmenten dient – kann sich zu einer Produktspannung entwickeln, wenn die Bedürfnisse auseinanderdriften.
Das Unternehmenssegment verlangt kontrolliertere, auditierbare Modelle, die sich in bestehende Pipelines integrieren lassen und klar definierte SLAs haben. Das Segment der einzelnen Ersteller verlangt Geschwindigkeit, Einfachheit und Preiswürdigkeit. Beide auf einer einzigen Plattform zu halten erfordert eine Produktarchitektur, die nicht immer sauber skaliert. Viele Softwareplattformen sind genau an diesem Punkt gescheitert: Im Wachstum verbraucht die Komplexität, zwei Segmente mit unterschiedlichen Logiken zu bedienen, Ingenieur-Ressourcen und verwässert das Wertversprechen, bis es unscharf wird.
Es gibt außerdem eine Wettbewerbsvariable, die die Erzählung der Finanzierungsrunde nicht ausdrücklich erwähnt, die aber den Horizont des Sektors definiert. Die großen Spiel-Engines – insbesondere Unity und Unreal Engine – investieren aktiv in prozedurale und KI-gestützte Generierungsfähigkeiten für 3D-Assets. Wenn diese Plattformen, die bereits native Integration in die Produktionsabläufe der Studios haben, 3D-Generierungswerkzeuge entwickeln, die mit Tripo AI vergleichbar sind, wird die Position von VAST als unabhängige Schicht komplizierter. Nicht weil VAST verschwindet, sondern weil sich der Verhandlungsspielraum darüber, wo der Wert in der Kette abgeschöpft wird, neu verteilt.
Das Projekt Eden ist die implizite Antwort auf dieses Risiko. Indem sich VAST in Richtung vollständiger Weltmodelle bewegt – navigierbare Umgebungen mit physikalischer Logik, mehreren Nutzern und dynamischer Generierung – zielt das Unternehmen auf eine Komplexitätsstufe ab, die Spiel-Engines kurzfristig nicht als native Funktion lösen werden. Es ist eine Wette darauf, das schwierigere Problem zu bauen, bevor die Konkurrenz das einfache löst.
Was 200 Millionen Dollar allein nicht kaufen
Die Wertverteilung in diesem Modell hat vorerst eine vernünftige Geometrie. Einzelne Nutzer erhalten echten Nutzen zu zugänglichen Preisen. Unternehmenskunden erhalten Kostenreduzierungen bei der Produktion an einem echten Engpass. Investoren erhalten Exposure gegenüber einem KI-Segment mit struktureller Nachfrage und nachgewiesener Dynamik. VAST erfasst Einnahmen auf zwei Ebenen und häuft Nutzungsdaten an, die die Verbesserung des Modells rückgekoppelt vorantreiben. Die Verteilungslogik zeigt, so wie sie ist, keine eindeutigen Anzeichen einer Abschöpfung in einer einzigen Richtung.
Aber die 200 Millionen Dollar kaufen keine Autonomie über das Wettbewerbsumfeld, keinen garantierten Zugang zu Recheninfrastruktur unter geopolitischen Einschränkungen und nicht die Fähigkeit, gleichzeitig die Qualität für den einzelnen Ersteller und die Robustheit für den Unternehmenskunden aufrechtzuerhalten. Sie kaufen auch keine unbegrenzte Zeit: Bei Abonnementmodellen für KI-Werkzeuge reagiert die Abwanderungsrate direkt auf die Geschwindigkeit, mit der Alternativen auftauchen. Das Kapital kauft nur die Möglichkeit, diese Probleme zu lösen, bevor sie teuer werden. VAST hat diese Möglichkeit. Wenn das Unternehmen sie gut umsetzt, kann das Einhorn von heute zur Infrastruktur der 3D-Inhalte des nächsten Jahrzehnts werden. Wenn nicht, werden die 200 Millionen Dollar die Decke sein, nicht das Sprungbrett.












