Agent-native article available: VAST e os US$ 200 milhões apostados no 3D generativo chinêsAgent-native article JSON available: VAST e os US$ 200 milhões apostados no 3D generativo chinês
VAST e os US$ 200 milhões apostados no 3D generativo chinês

VAST e os US$ 200 milhões apostados no 3D generativo chinês

Simon Song tinha 29 anos quando fechou uma rodada de US$ 200 milhões e cruzou o limiar do bilhão de dólares em valuation. VAST, sua startup de modelos de inteligência artificial para conteúdo tridimensional, acaba de se tornar um unicórnio. O anúncio chega apenas três meses depois de a empresa fechar sua Série A com US$ 50 milhões liderada pela Alibaba e Hengxu Capital.

Martín SolerMartín Soler3 de junho de 20269 min
Compartilhar

VAST e os $200 milhões apostados no 3D generativo chinês

Simon Song tinha 29 anos quando fechou uma rodada de $200 milhões e cruzou o limiar do bilhão de dólares em valuation. VAST, sua startup de modelos de inteligência artificial para conteúdo tridimensional, acaba de se tornar um unicórnio. O anúncio chega apenas três meses depois de a empresa ter encerrado sua Série A com $50 milhões liderada pela Alibaba e pela Hengxu Capital. O ritmo dessa sequência — $50 milhões em março, $200 milhões em junho — não é apenas um sinal de tração operacional. É um sinal sobre que tipo de aposta os investidores estão fazendo neste momento e por que o 3D generativo ocupa esse lugar.

Song apareceu neste ano na lista Forbes 30 Under 30 Ásia. Antes de fundar a VAST em 2023, havia trabalhado como assistente do cofundador da SenseTime e sido cofundador da MiniMax, outra empresa de modelos de IA. Sua plataforma Tripo AI converte texto e imagens em objetos tridimensionais detalhados em segundos. Os clientes incluem a NetEase, o gigante chinês dos videogames, e a Sony. A base de usuários chega a 20 milhões de pessoas em todo o mundo, com presença especial nos Estados Unidos, na Europa e no Japão. As assinaturas variam de $20 a $140 mensais. Os projetos empresariais são faturados separadamente. Com esse anúncio de financiamento veio também o lançamento do Projeto Eden: um programa para construir modelos de mundo, ou seja, sistemas de IA capazes de gerar ambientes virtuais que múltiplos usuários possam explorar e com os quais possam interagir.

Aí está o caso. O que merece atenção não é o número em si, mas a estrutura de valor que esse número revela — e as tensões que ainda não se enxergam de fora.

O 3D como infraestrutura, não como produto

A geração de imagens por IA chegou primeiro porque o problema era mais barato de resolver: dados abundantes, output verificável na hora, demanda massiva de criadores individuais. O 3D levou mais tempo porque os requisitos computacionais são superiores, os dados de treinamento são mais escassos e a cadeia de uso é mais complexa. Transformar um prompt em texto é uma coisa. Transformá-lo em um objeto tridimensional navegável, com proporções físicas coerentes e qualidade suficiente para produção em tempo real, é um nível de dificuldade completamente diferente.

Essa dificuldade é precisamente o que torna o segmento atraente para capital de crescimento. Quando um problema técnico é genuinamente difícil e a demanda está claramente formada, quem o resolve primeiro com escala tem uma vantagem que não se replica em semanas. A criação de ativos 3D representa hoje um dos gargalos mais custosos na produção de videogames, simulações industriais, experiências de realidade aumentada e gêmeos digitais para manufatura. Um estúdio de desenvolvimento de videogames de médio porte pode gastar entre 30% e 50% de seu orçamento de produção apenas em arte e modelagem 3D. Comprimir esse custo com IA não é uma melhoria incremental: é uma reconversão da estrutura de gastos do negócio.

O que a VAST está posicionando com a Tripo AI é, em sua lógica mais profunda, uma camada de infraestrutura para a criação de conteúdo tridimensional. Não um produto de nicho para designers avançados, mas uma plataforma que pode se integrar aos fluxos de produção de estúdios de videogames, empresas de design industrial, plataformas de comércio eletrônico e simuladores de treinamento. Quando uma startup tem 20 milhões de usuários e clientes como NetEase e Sony nos primeiros dois ou três anos de existência, o sinal é de que ela encontrou demanda em camadas simultâneas: o criador individual que paga $20 por mês e a corporação que paga por projeto. Essa dupla face do modelo de receitas é importante porque reduz a dependência de um único canal e distribui o risco de churn.

O Projeto Eden eleva a aposta em uma direção específica: os modelos de mundo. Fei-Fei Li captou $1 bilhão para a World Labs nesse mesmo segmento no início deste ano. O movimento da VAST em direção à mesma área, com uma escala de capital menor mas com uma plataforma operacional já implantada, sugere que a empresa aposta que a vantagem competitiva futura não estará apenas em gerar objetos 3D, mas em gerar ambientes completos e navegáveis, o que muda radicalmente a escala do mercado-alvo.

Onde está o capital e quais incentivos o movem

Os investidores nesta rodada incluem a INCE Capital, a Genesis Capital e o Primavera Capital Group. Não são fundos generalistas. São players com exposição profunda ao ecossistema tecnológico chinês e com capacidade de acompanhar rodadas de crescimento em direção à escala. A participação prévia da Alibaba na Série A não é decorativa: a Alibaba tem interesse direto em que existam ferramentas de geração de conteúdo 3D que possam se integrar com suas plataformas de comércio, seus serviços em nuvem e seus projetos de entretenimento.

Isso coloca uma questão de estrutura que vale a pena examinar com cuidado. Quando um investidor estratégico como a Alibaba entra em uma rodada inicial e depois a empresa fecha uma rodada de acompanhamento quatro vezes maior, há duas leituras possíveis. A primeira é que a tração foi tão clara que os novos investidores financeiros entraram com convicção independente. A segunda é que o respaldo da Alibaba funcionou como sinal de legitimidade que facilitou o fechamento com outros fundos. Ambas as leituras podem ser simultaneamente verdadeiras, e a distinção importa porque define o grau de autonomia da trajetória da VAST em relação aos seus investidores estratégicos.

O detalhe sobre o valuation é igualmente revelador. De acordo com duas pessoas com conhecimento da operação, o valuation supera $1 bilhão; uma delas o situa próximo de $1,5 bilhão. O fato de a VAST não confirmar publicamente seu valuation é uma prática habitual em startups em estágio de crescimento, mas também reflete que a empresa prefere manter flexibilidade na forma como se apresenta ao mercado. Com $250 milhões acumulados em duas rodadas durante o mesmo ano, o capital disponível para ser implantado é substancial. A empresa anunciou que o utilizará em contratações, pesquisa e desenvolvimento.

Esse destino dos recursos tem uma lógica clara: em IA generativa, a margem de vantagem se constrói na qualidade do modelo e na capacidade de iterá-lo mais rápido do que os concorrentes. Contratar equipes de pesquisa de alto nível na China é mais barato do que no Vale do Silício, o que faz com que cada dólar se converta em maior densidade de talento. Mas essa vantagem tem um limite conhecido: a disponibilidade de chips de treinamento avançados, que na China opera sob restrições de exportação impostas pelo governo dos Estados Unidos. Como a VAST resolve esse gargalo computacional sem acesso irrestrito às GPUs mais potentes do mercado é uma variável que os investidores conhecem e que o mercado externo não consegue ler com clareza.

A fragilidade que o sucesso ainda oculta

O modelo de receitas da VAST combina assinaturas individuais e faturamento empresarial por projeto. Isso é estruturalmente saudável: as receitas recorrentes de 20 milhões de usuários geram uma base previsível, enquanto os contratos corporativos com estúdios como NetEase e Sony aportam volume por operação. No entanto, há uma tensão de fundo que merece atenção antes que a narrativa do unicórnio a encubra.

As plataformas de ferramentas para criadores e para empresas vivem em lógicas diferentes. O usuário individual paga por utilidade imediata e troca de ferramenta quando aparece algo melhor ou mais barato. A empresa paga por integração, suporte e garantia de continuidade, mas também negocia preços e pode desenvolver capacidades internas se a ferramenta se tornar suficientemente madura. O que hoje parece uma vantagem — que a plataforma sirva a ambos os segmentos — pode se transformar em uma tensão de produto se as necessidades divergirem.

O segmento empresarial exige modelos mais controláveis, auditáveis, integráveis com pipelines existentes e com SLAs bem definidos. O segmento de criadores individuais exige velocidade, simplicidade e preço acessível. Manter ambos em uma única plataforma requer uma arquitetura de produto que nem sempre escala de forma limpa. Muitas plataformas de software falharam exatamente nesse ponto: ao crescer, a complexidade de servir a dois segmentos com lógicas distintas consome recursos de engenharia e fragmenta a proposta de valor até torná-la difusa.

Há ainda uma variável competitiva que a narrativa da rodada não menciona explicitamente, mas que define o horizonte do setor. As grandes engines de videogame — Unity e Unreal Engine em particular — estão investindo ativamente em capacidades de geração procedural e assistida por IA para ativos 3D. Se essas plataformas, que já têm integração nativa nos fluxos de produção dos estúdios, desenvolverem ferramentas de geração 3D comparáveis à Tripo AI, a posição da VAST como camada independente se complica. Não porque a VAST desapareça, mas porque o espaço de negociação sobre onde o valor é capturado na cadeia se redistribui.

O Projeto Eden é a resposta implícita a esse risco. Ao avançar em direção a modelos de mundo completos — ambientes navegáveis com lógica física, múltiplos usuários e geração dinâmica — a VAST mira um nível de complexidade que as engines de jogos não vão resolver no curto prazo como função nativa. É uma aposta em construir o problema mais difícil antes que a concorrência chegue a resolver o mais fácil.

O que $200 milhões não compram sozinhos

A distribuição de valor neste modelo tem, por ora, uma geometria razoável. Os usuários individuais recebem utilidade real a preços acessíveis. Os clientes corporativos recebem redução de custos de produção em um gargalo genuíno. Os investidores recebem exposição a um segmento de IA com demanda estrutural e tração demonstrada. A VAST captura receitas em duas camadas e acumula dados de uso que retroalimentam a melhoria do modelo. A lógica distributiva, tal como está, não apresenta sinais evidentes de extração em uma única direção.

Mas os $200 milhões não compram autonomia sobre o ambiente competitivo, acesso garantido a infraestrutura computacional sob restrições geopolíticas nem a capacidade de manter simultaneamente a qualidade para o criador individual e a robustez para o cliente corporativo. Tampouco compram tempo indefinido: em modelos de assinatura para ferramentas de IA, a taxa de abandono responde diretamente à velocidade com que surgem alternativas. O capital apenas compra a possibilidade de resolver esses problemas antes que se tornem custosos. A VAST tem essa possibilidade. Se a executar bem, o unicórnio de hoje pode se tornar a infraestrutura do conteúdo 3D da próxima década. Se não, os $200 milhões serão o teto, não o trampolim.

Compartilhar

Você também pode gostar