VAST社と、中国発の生成系3Dに賭けられた2億ドル
サイモン・ソンが29歳のとき、2億ドルの資金調達ラウンドをクローズし、評価額10億ドルの大台を超えた。彼が率いるスタートアップ、VASTは3次元コンテンツ向けの人工知能モデルを開発しており、このたびユニコーン企業の仲間入りを果たした。この発表は、同社がアリババとHengxu Capitalが主導した5000万ドルのシリーズAラウンドをクローズしてからわずか3カ月後のことだ。一連のシーケンス——3月に5000万ドル、6月に2億ドル——は単なる事業上の勢いを示すシグナルではない。これは、現時点で投資家がどのような賭けに出ているのか、そしてなぜ生成系3Dがその中心に位置しているのかを示すシグナルである。
ソンは今年、「Forbes 30 Under 30 Asia」にリストアップされた。2023年にVASTを創業する前は、SenseTimeの共同創業者のアシスタントとして勤務し、別のAIモデル企業であるMiniMaxの共同創業者を務めた経験を持つ。同社のプラットフォーム「Tripo AI」は、テキストや画像を数秒で詳細な3次元オブジェクトに変換する。クライアントには中国のゲーム大手NetEaseやSonyが名を連ねる。ユーザー数は世界全体で2000万人に達しており、米国・欧州・日本での存在感が特に大きい。サブスクリプションの料金は月額20ドルから140ドルで、企業向けプロジェクトは別途見積もりとなる。この資金調達の発表と同時に、「プロジェクト・エデン」のローンチも告知された。これは「ワールドモデル」——複数のユーザーが探索・インタラクションできる仮想環境を生成できるAIシステム——を構築するためのプログラムである。
ここに本質がある。注目すべきなのは数字そのものではなく、その数字が明かす価値の構造であり、そしていまだ外部からは見えていない緊張関係だ。
3Dはプロダクトではなくインフラである
AIによる画像生成が先に普及した理由は、解決コストがより低かったからだ。豊富なデータ、即座に検証可能なアウトプット、個人クリエイターからの大規模な需要——これらすべてが揃っていた。3Dに時間がかかったのは、計算上の要件がより高く、学習データがより希少であり、用途の連鎖がより複雑だからだ。プロンプトをテキストに変換するのは一つのことだ。それを、物理的な比率が整合し、リアルタイム制作に十分な品質を持つ、ナビゲーション可能な3次元オブジェクトに変換することは、まったく別次元の難しさである。
その難しさこそが、このセグメントを成長資本にとって魅力的たらしめている要因だ。技術的な問題が真に困難であり、需要が明確に形成されているとき、スケールを伴って最初にそれを解決した者は、数週間では複製できない優位性を手にする。3Dアセットの制作は今日、ビデオゲーム制作、産業シミュレーション、拡張現実体験、製造業向けデジタルツインにおける最もコストのかかるボトルネックの一つだ。中規模のゲーム開発スタジオは、制作予算の30%から50%をアートと3Dモデリングだけに費やすことがある。AIによってそのコストを圧縮することは、インクリメンタルな改善ではない——それはビジネスの費用構造の再編である。
VASTがTripo AIで構築しようとしているポジションは、より深いロジックで捉えると、3次元コンテンツ制作のためのインフラ層だ。上級デザイナー向けのニッチな製品ではなく、ゲームスタジオ、工業デザイン会社、Eコマースプラットフォーム、トレーニングシミュレーターの制作フローに統合できるプラットフォームだ。スタートアップが創業から2〜3年で2000万人のユーザーを獲得し、NetEaseやSonyのような顧客を持つとき、それは複数の層で同時に需要を捉えたというシグナルだ——月額20ドルを支払う個人クリエイターと、プロジェクト単位で支払う大企業という、二つの層である。この収益モデルの二面性は重要だ。なぜなら、単一チャネルへの依存度を下げ、チャーンリスクを分散させるからだ。
プロジェクト・エデンは、特定の方向へとさらに大きな賭けに出るものだ。フェイフェイ・リーは今年初め、同じワールドモデルのセグメントでWorld Labsのために10億ドルを調達した。より小さな資本規模ながら、既に稼働中のプラットフォームを持つVASTが同じ方向へ動いていることは、同社が将来の競争優位は3Dオブジェクトを生成することだけにあるのではなく、完全でナビゲーション可能な環境を生成することにあると賭けていることを示唆している。これはターゲット市場の規模を根本的に変えることになる。
資本がどこに集まり、どのようなインセンティブがそれを動かすか
今回のラウンドの投資家には、INCE Capital、Genesis Capital、Primavera Capital Groupが名を連ねる。これらは汎用的なファンドではない。中国のテクノロジーエコシステムに深く関与し、スケールへの成長ラウンドに随伴できるプレイヤーだ。シリーズAにおけるアリババの先行参加は飾りではない——アリババは、自社のコマースプラットフォーム、クラウドサービス、エンターテインメントプロジェクトに統合できる3Dコンテンツ生成ツールが存在することに直接的な利害関係を持っている。
これは、慎重に検討する価値のある構造的な問いを提起する。アリババのような戦略的投資家が初期ラウンドに参入し、その後同社がその4倍の規模のフォローオンラウンドをクローズするとき、二つの読み方が可能だ。一つ目は、トラクションが非常に明確だったため、新たな財務的投資家が独立した確信を持って参入したというものだ。二つ目は、アリババの後ろ盾が正当性のシグナルとして機能し、他のファンドとのクローズを促進したというものだ。両方の読み方が同時に真実である可能性があり、その区別は重要だ——なぜなら、それがVASTの軌道が戦略的投資家に対してどれほど自律的であるかを定義するからだ。
評価額に関する詳細も同様に示唆的だ。この取引を把握している2人の関係者によれば、評価額は10億ドルを超えており、そのうちの1人は15億ドル近くと位置づけている。VASTが評価額を公式に確認しないことは成長段階のスタートアップでは一般的な慣行だが、同時に、会社が市場への自社の見せ方において柔軟性を維持したいと考えていることも反映している。同一年内に2つのラウンドで合計2億5000万ドルを積み上げたことで、デプロイ可能な資本は相当な規模となる。同社はこれを採用と研究開発に充てると発表した。
この資金の用途には明確なロジックがある。生成AIにおいて、優位性のマージンはモデルの質と、競合他社よりも速く反復できる能力によって構築される。中国で高水準の研究チームを採用することはシリコンバレーよりも安価であり、各ドルがより高密度の才能に変換される。しかしこの優位性には既知の限界がある——高度な学習用チップの入手可能性だ。中国ではこれが、米国政府が課した輸出規制のもとで制約を受けている。市場で最も強力なGPUへの無制限のアクセスなしに、VASTがこの計算上のボトルネックをどのように解決するかは、投資家が把握している変数でありながら、外部市場からは明確に読み取ることができない。
成功がいまだ覆い隠している脆さ
VASTの収益モデルは、個人向けサブスクリプションとプロジェクト単位の企業向け請求を組み合わせている。これは構造的に健全だ——2000万ユーザーからの定期収益が予測可能なベースを生み出す一方、NetEaseやSonyのようなスタジオとの企業契約が取引ごとの大きな収益をもたらす。しかし、ユニコーンの語りがそれを覆い隠す前に注意を要する、根本的な緊張関係がある。
クリエイターと企業の双方を対象としたツールプラットフォームは、異なるロジックの中で生きている。個人ユーザーはインスタントな有用性に対して支払いをし、より良いものや安価なものが現れれば別のツールに乗り換える。企業は統合、サポート、継続性の保証に対して支払うが、同時に価格交渉も行い、ツールが十分に成熟すれば社内能力を開発することもある。今日は優位性に見えること——プラットフォームが両方のセグメントに対応していること——は、ニーズが乖離した場合、製品上の緊張へと転化する可能性がある。
企業セグメントは、よりコントロール可能で、監査可能で、既存のパイプラインに統合可能であり、明確に定義されたSLAを持つモデルを要求する。個人クリエイターのセグメントは速度、シンプルさ、価格を要求する。両者を単一のプラットフォームで維持するには、常にクリーンにスケールするわけではないプロダクトアーキテクチャが必要だ。多くのソフトウェアプラットフォームがまさにこの点で失敗してきた——成長とともに、異なるロジックを持つ2つのセグメントにサービスを提供する複雑さがエンジニアリングリソースを消費し、バリュープロポジションを希薄化させて不明瞭にしてしまうのだ。
さらに、ラウンドの語りが明示的に言及していないが、セクターの地平線を定義する競合上の変数がある。主要なゲームエンジン——特にUnityとUnreal Engine——は、3Dアセットのプロシージャル生成とAI支援生成の能力に積極的に投資している。これらのプラットフォームが、スタジオの制作フローにすでにネイティブ統合されている状態で、Tripo AIに匹敵する3D生成ツールを開発した場合、独立した層としてのVASTのポジションは複雑になる。VASTが消えるからではなく、チェーン内でどこに価値が捕捉されるかという交渉空間が再分配されるからだ。
プロジェクト・エデンは、このリスクへの暗黙の回答だ。物理的なロジック、複数ユーザー、ダイナミックな生成を備えたナビゲーション可能な環境である完全なワールドモデルへと移行することで、VASTはゲームエンジンが短期的にネイティブ機能として解決しないであろう複雑さのレベルを狙っている。これは、競合が易しい問題を解決しに来る前に、より難しい問題を構築しておこうという賭けだ。
2億ドルだけでは買えないもの
このモデルにおける価値配分は、今のところ合理的な形状を持っている。個人ユーザーは手頃な価格で本物の利便性を受け取る。企業クライアントは本物のボトルネックにおける制作コストの削減を受け取る。投資家は、構造的な需要と実証済みのトラクションを持つAIセグメントへのエクスポージャーを受け取る。VASTは2つの層で収益を獲得し、モデルの改善にフィードバックされる使用データを蓄積する。配分のロジックは現状、一方向への搾取の明らかな兆候を示していない。
しかし、2億ドルは、競争環境に対する自律性、地政学的な制約下での計算インフラへの保証されたアクセス、個人クリエイターへの質と企業クライアントへのロバスト性を同時に維持する能力を買えるわけではない。また、無限の時間を買えるわけでもない——AIツールのサブスクリプションモデルにおいて、離脱率は代替選択肢が現れる速さに直接応答する。資本が買えるのは、それらの問題がコスト高になる前に解決する可能性だけだ。VASTにはその可能性がある。それをうまく実行すれば、今日のユニコーンは次の10年における3Dコンテンツのインフラになり得る。そうでなければ、2億ドルはトランポリンではなく、天井になるだろう。












