VAST और वो $200 मिलियन जो चीनी जनरेटिव 3D पर लगाए गए
Simon Song की उम्र 29 साल थी जब उन्होंने $200 मिलियन का राउंड बंद किया और वैल्यूएशन में एक अरब डॉलर की सीमा पार की। VAST, त्रि-आयामी सामग्री के लिए आर्टिफिशियल इंटेलिजेंस मॉडल बनाने वाला उनका स्टार्टअप, अभी-अभी यूनिकॉर्न बना है। यह घोषणा उस समय से मात्र तीन महीने बाद आई है जब कंपनी ने Alibaba और Hengxu Capital के नेतृत्व में $50 मिलियन की सीरीज़ A बंद की थी। इस क्रम की गति — मार्च में $50 मिलियन, जून में $200 मिलियन — केवल परिचालन कर्षण का संकेत नहीं है। यह इस बात का संकेत है कि निवेशक इस समय किस तरह का दांव लगा रहे हैं और क्यों जनरेटिव 3D उस स्थान पर काबिज है।
Song इस साल Forbes 30 Under 30 Asia की सूची में शामिल हुए। 2023 में VAST की स्थापना से पहले वे SenseTime के सह-संस्थापक के सहायक के रूप में काम कर चुके थे और AI मॉडल की एक अन्य फर्म MiniMax के सह-संस्थापक रह चुके थे। उनका प्लेटफ़ॉर्म Tripo AI, टेक्स्ट और छवियों को कुछ ही सेकंड में विस्तृत त्रि-आयामी वस्तुओं में बदल देता है। ग्राहकों में चीन के वीडियोगेम दिग्गज NetEase और Sony शामिल हैं। दुनिया भर में यूज़र बेस 2 करोड़ लोगों तक पहुँच गया है, जिसमें अमेरिका, यूरोप और जापान में विशेष उपस्थिति है। सब्सक्रिप्शन $20 से $140 प्रति माह तक है। एंटरप्राइज़ परियोजनाओं की बिलिंग अलग से होती है। इस फंडिंग घोषणा के साथ Project Eden का शुभारंभ भी हुआ: एक कार्यक्रम जो वर्ल्ड मॉडल बनाने के लिए है, यानी ऐसी AI प्रणालियाँ जो आभासी वातावरण उत्पन्न करने में सक्षम हों जिसे कई उपयोगकर्ता एक साथ एक्सप्लोर कर सकें और जिनके साथ इंटरैक्ट कर सकें।
यही तो मुद्दा है। जो बात ध्यान देने योग्य है वह यह संख्या नहीं है, बल्कि वह मूल्य संरचना है जो इस संख्या से उजागर होती है — और वे तनाव जो अभी बाहर से दिखाई नहीं देते।
3D एक उत्पाद नहीं, बुनियादी ढाँचे के रूप में
AI द्वारा छवि निर्माण पहले आया क्योंकि समस्या को हल करना सस्ता था: प्रचुर डेटा, तत्काल सत्यापन योग्य आउटपुट, व्यक्तिगत निर्माताओं की ओर से भारी माँग। 3D को अधिक समय लगा क्योंकि कम्प्यूटेशनल आवश्यकताएँ अधिक हैं, प्रशिक्षण डेटा अधिक दुर्लभ है और उपयोग की शृंखला अधिक जटिल है। एक प्रॉम्प्ट को टेक्स्ट में बदलना एक बात है। उसे एक नेविगेट करने योग्य त्रि-आयामी वस्तु में बदलना — जिसमें सुसंगत भौतिक अनुपात और रियल-टाइम उत्पादन के लिए पर्याप्त गुणवत्ता हो — कठिनाई का एक अलग ही स्तर है।
यही कठिनाई इस सेगमेंट को विकास पूँजी के लिए आकर्षक बनाती है। जब कोई तकनीकी समस्या वास्तव में कठिन हो और माँग स्पष्ट रूप से बनी हो, तो जो पहले उसे स्केल के साथ हल करता है, उसे एक ऐसा लाभ मिलता है जिसे हफ्तों में दोहराया नहीं जा सकता। 3D संपत्तियों का निर्माण आज वीडियोगेम उत्पादन, औद्योगिक सिमुलेशन, संवर्धित वास्तविकता अनुभव और विनिर्माण के लिए डिजिटल ट्विन में सबसे महँगी बाधाओं में से एक का प्रतिनिधित्व करता है। मध्यम आकार का एक वीडियोगेम विकास स्टूडियो अपने उत्पादन बजट का 30% से 50% तक केवल कला और 3D मॉडलिंग पर खर्च कर सकता है। AI के साथ उस लागत को कम करना एक क्रमिक सुधार नहीं है: यह व्यवसाय की खर्च संरचना का पुनर्रूपांतरण है।
Tripo AI के साथ VAST जो स्थिति बना रहा है, वह अपनी गहरी तर्क में त्रि-आयामी सामग्री निर्माण के लिए एक बुनियादी ढाँचे की परत है। उन्नत डिज़ाइनरों के लिए एक नॉच उत्पाद नहीं, बल्कि एक ऐसा प्लेटफ़ॉर्म जिसे वीडियोगेम स्टूडियो, औद्योगिक डिज़ाइन फर्म, ई-कॉमर्स प्लेटफ़ॉर्म और प्रशिक्षण सिमुलेटर के उत्पादन प्रवाह में एकीकृत किया जा सकता है। जब एक स्टार्टअप के अस्तित्व के पहले दो या तीन वर्षों में 2 करोड़ उपयोगकर्ता और NetEase तथा Sony जैसे ग्राहक हों, तो संकेत यह है कि उसने एक साथ कई परतों में माँग खोज ली है: वह व्यक्तिगत निर्माता जो प्रति माह $20 देता है और वह निगम जो प्रति परियोजना भुगतान करता है। राजस्व मॉडल का यह दोहरा पहलू महत्वपूर्ण है क्योंकि यह एकल चैनल पर निर्भरता को कम करता है और churn के जोखिम को वितरित करता है।
Project Eden दांव को एक विशिष्ट दिशा में बढ़ाता है: वर्ल्ड मॉडल। Fei-Fei Li ने इस साल की शुरुआत में उसी सेगमेंट में World Labs के लिए $1 अरब जुटाए। उसी दिशा में VAST का कदम — कम पूँजी पैमाने पर लेकिन एक पहले से तैनात परिचालन प्लेटफ़ॉर्म के साथ — यह सुझाव देता है कि कंपनी का दांव है कि भविष्य में प्रतिस्पर्धात्मक लाभ केवल 3D वस्तुएँ उत्पन्न करने में नहीं बल्कि संपूर्ण नेविगेट करने योग्य वातावरण उत्पन्न करने में होगा, जो लक्षित बाज़ार के पैमाने को मौलिक रूप से बदल देता है।
पूँजी कहाँ है और उसे क्या प्रोत्साहन मिल रहे हैं
इस राउंड में निवेशकों में INCE Capital, Genesis Capital और Primavera Capital Group शामिल हैं। ये सामान्यवादी फंड नहीं हैं। ये चीनी तकनीकी पारिस्थितिकी तंत्र में गहरे एक्सपोज़र वाले और विकास राउंड को स्केल तक ले जाने की क्षमता रखने वाले खिलाड़ी हैं। सीरीज़ A में Alibaba की पूर्व भागीदारी सजावटी नहीं है: Alibaba की सीधी रुचि है कि 3D सामग्री निर्माण के ऐसे उपकरण हों जिन्हें उनके कॉमर्स प्लेटफ़ॉर्म, उनकी क्लाउड सेवाओं और उनके मनोरंजन परियोजनाओं के साथ एकीकृत किया जा सके।
यह एक संरचनात्मक प्रश्न उठाता है जिसे ध्यान से परखना उचित है। जब Alibaba जैसा रणनीतिक निवेशक किसी शुरुआती राउंड में प्रवेश करता है और फिर कंपनी उस आकार के चार गुना के फॉलो-ऑन राउंड को बंद करती है, तो दो संभावित व्याख्याएँ हैं। पहली यह कि कर्षण इतना स्पष्ट था कि नए वित्तीय निवेशक स्वतंत्र दृढ़ विश्वास के साथ प्रवेश किए। दूसरी यह कि Alibaba के समर्थन ने वैधता के संकेत के रूप में काम किया जिसने अन्य फंडों के साथ समापन को आसान बनाया। दोनों व्याख्याएँ एक साथ सत्य हो सकती हैं, और यह अंतर मायने रखता है क्योंकि यह परिभाषित करता है कि VAST की गति अपने रणनीतिक निवेशकों के संदर्भ में कितनी स्वायत्त है।
वैल्यूएशन का विवरण भी उतना ही खुलासा करने वाला है। ऑपरेशन की जानकारी रखने वाले दो लोगों के अनुसार, वैल्यूएशन $1 अरब से अधिक है; उनमें से एक इसे $1.5 अरब के करीब बताता है। VAST द्वारा सार्वजनिक रूप से अपनी वैल्यूएशन की पुष्टि न करना विकास चरण के स्टार्टअप में सामान्य प्रचलन है, लेकिन यह यह भी दर्शाता है कि कंपनी बाज़ार में अपनी प्रस्तुति में लचीलापन बनाए रखना पसंद करती है। एक ही वर्ष में दो राउंड में $250 मिलियन संचित होने के साथ, तैनात करने के लिए उपलब्ध पूँजी पर्याप्त है। कंपनी ने घोषणा की कि वह इसका उपयोग भर्ती और अनुसंधान एवं विकास में करेगी।
फंड के इस गंतव्य की एक स्पष्ट तर्क है: जनरेटिव AI में, लाभ का मार्जिन मॉडल की गुणवत्ता और प्रतिस्पर्धियों की तुलना में तेज़ी से उसे पुनरावृत्त करने की क्षमता में बनता है। चीन में उच्च स्तरीय अनुसंधान टीमों को नियुक्त करना Silicon Valley की तुलना में सस्ता है, जो प्रत्येक डॉलर को प्रतिभा के अधिक घनत्व में परिवर्तित करता है। लेकिन उस लाभ की एक ज्ञात सीमा है: उन्नत प्रशिक्षण चिप्स की उपलब्धता, जो चीन में अमेरिकी सरकार द्वारा लगाए गए निर्यात प्रतिबंधों के तहत संचालित होती है। VAST बाज़ार के सबसे शक्तिशाली GPU तक अप्रतिबंधित पहुँच के बिना उस कम्प्यूटेशनल बाधा को कैसे हल करता है — यह एक ऐसा चर है जिसे निवेशक जानते हैं लेकिन जिसे बाहरी बाज़ार स्पष्ट रूप से नहीं पढ़ सकता।
वह नाज़ुकता जिसे सफलता अभी छुपा रही है
VAST का राजस्व मॉडल व्यक्तिगत सब्सक्रिप्शन और परियोजना-दर-परियोजना एंटरप्राइज़ बिलिंग को जोड़ता है। यह संरचनात्मक रूप से स्वस्थ है: 2 करोड़ उपयोगकर्ताओं से आवर्ती आय एक पूर्वानुमानित आधार बनाती है, जबकि NetEase और Sony जैसे स्टूडियो के साथ कॉर्पोरेट अनुबंध प्रति ऑपरेशन वॉल्यूम प्रदान करते हैं। हालाँकि, एक मूल तनाव है जो यूनिकॉर्न की कहानी से पहले ध्यान देने योग्य है।
निर्माताओं और उद्यमों के लिए उपकरण प्लेटफ़ॉर्म अलग-अलग तर्कों में जीते हैं। व्यक्तिगत उपयोगकर्ता तत्काल उपयोगिता के लिए भुगतान करता है और जब कुछ बेहतर या सस्ता आता है तो उपकरण बदल लेता है। उद्यम एकीकरण, समर्थन और निरंतरता की गारंटी के लिए भुगतान करता है, लेकिन कीमतों पर भी बातचीत करता है और अगर उपकरण पर्याप्त रूप से परिपक्व हो जाए तो आंतरिक क्षमताएँ विकसित कर सकता है। जो आज एक लाभ लगता है — कि प्लेटफ़ॉर्म दोनों सेगमेंट को सेवा देता है — एक उत्पाद तनाव में बदल सकता है यदि ज़रूरतें अलग हो जाती हैं।
एंटरप्राइज़ सेगमेंट को अधिक नियंत्रणीय, ऑडिट करने योग्य, मौजूदा पाइपलाइन के साथ एकीकृत करने योग्य और अच्छी तरह से परिभाषित SLA वाले मॉडल की आवश्यकता होती है। व्यक्तिगत निर्माता सेगमेंट को गति, सरलता और कीमत की आवश्यकता होती है। दोनों को एक ही प्लेटफ़ॉर्म पर बनाए रखने के लिए एक उत्पाद आर्किटेक्चर की आवश्यकता है जो हमेशा साफ तरीके से स्केल नहीं होता। कई सॉफ़्टवेयर प्लेटफ़ॉर्म ठीक उसी बिंदु पर विफल हुए हैं: बढ़ते समय, अलग-अलग तर्कों वाले दो सेगमेंट की सेवा करने की जटिलता इंजीनियरिंग संसाधनों को खा जाती है और मूल्य प्रस्ताव को इतना धुँधला कर देती है।
इसके अलावा एक प्रतिस्पर्धी चर है जिसे राउंड की कहानी स्पष्ट रूप से उल्लेख नहीं करती लेकिन जो क्षेत्र के क्षितिज को परिभाषित करती है। प्रमुख वीडियोगेम इंजन — विशेष रूप से Unity और Unreal Engine — 3D संपत्तियों के लिए प्रक्रियात्मक और AI-सहायता प्राप्त निर्माण क्षमताओं में सक्रिय रूप से निवेश कर रहे हैं। यदि वे प्लेटफ़ॉर्म, जिनका पहले से स्टूडियो के उत्पादन प्रवाह में मूल एकीकरण है, Tripo AI के तुलनीय 3D निर्माण उपकरण विकसित करते हैं, तो एक स्वतंत्र परत के रूप में VAST की स्थिति जटिल हो जाती है। इसलिए नहीं कि VAST गायब हो जाएगा, बल्कि इसलिए कि श्रृंखला में मूल्य कहाँ पकड़ा जाता है, इस पर बातचीत का स्थान पुनर्वितरित हो जाता है।
Project Eden उस जोखिम का अंतर्निहित जवाब है। संपूर्ण वर्ल्ड मॉडल की ओर बढ़ते हुए — भौतिक तर्क, कई उपयोगकर्ताओं और गतिशील निर्माण के साथ नेविगेट करने योग्य वातावरण — VAST जटिलता के उस स्तर पर दांव लगाता है जिसे गेम इंजन निकट भविष्य में मूल फ़ंक्शन के रूप में हल नहीं करने वाले। यह सबसे कठिन समस्या को तब बनाने का दांव है जब प्रतिस्पर्धा अभी आसान को हल करने तक नहीं पहुँची।
वो चीज़ें जो $200 मिलियन अकेले नहीं खरीद सकते
इस मॉडल में मूल्य का वितरण अभी के लिए एक उचित ज्यामिति रखता है। व्यक्तिगत उपयोगकर्ताओं को सुलभ कीमतों पर वास्तविक उपयोगिता मिलती है। कॉर्पोरेट ग्राहकों को एक वास्तविक बाधा में उत्पादन लागत में कमी मिलती है। निवेशकों को संरचनात्मक माँग और प्रदर्शित कर्षण वाले AI सेगमेंट में एक्सपोज़र मिलता है। VAST दो परतों में आय अर्जित करता है और उपयोग डेटा जमा करता है जो मॉडल सुधार में वापस आता है। वितरणात्मक तर्क, जैसा है, एक दिशा में निष्कर्षण के स्पष्ट संकेत नहीं दिखाता।
लेकिन $200 मिलियन प्रतिस्पर्धात्मक वातावरण पर स्वायत्तता नहीं खरीदते, भू-राजनीतिक प्रतिबंधों के तहत कम्प्यूटेशनल बुनियादी ढाँचे तक गारंटीकृत पहुँच नहीं खरीदते, और न ही व्यक्तिगत निर्माता के लिए गुणवत्ता तथा कॉर्पोरेट ग्राहक के लिए मजबूती को एक साथ बनाए रखने की क्षमता खरीदते हैं। यह अनिश्चित समय भी नहीं खरीदते: AI उपकरणों के सब्सक्रिप्शन मॉडल में, परित्याग दर सीधे उस गति के जवाब में होती है जिस पर विकल्प सामने आते हैं। पूँजी केवल उन समस्याओं को हल करने की संभावना खरीदती है जब से पहले कि वे महँगी हो जाएँ। VAST के पास यह संभावना है। यदि वे इसे अच्छी तरह से क्रियान्वित करते हैं, तो आज का यूनिकॉर्न अगले दशक की 3D सामग्री का बुनियादी ढाँचा बन सकता है। यदि नहीं, तो $200 मिलियन छत होंगे, ट्रैम्पोलीन नहीं।











