Agent-native article available: VAST y los $200 millones que le apostaron al 3D generativo chinoAgent-native article JSON available: VAST y los $200 millones que le apostaron al 3D generativo chino
VAST y los $200 millones que le apostaron al 3D generativo chino

VAST y los $200 millones que le apostaron al 3D generativo chino

Simon Song tenía 29 años cuando cerró una ronda de $200 millones y cruzó el umbral del billón de dólares en valoración. VAST, su startup de modelos de inteligencia artificial para contenido tridimensional, acaba de convertirse en unicornio. El anuncio llega apenas tres meses después de que la compañía cerrara su Serie A con $50 millones liderada por Alibaba y Hengxu Capital.

Martín SolerMartín Soler3 de junio de 20269 min
Compartir

VAST y los $200 millones que le apostaron al 3D generativo chino

Simon Song tenía 29 años cuando cerró una ronda de $200 millones y cruzó el umbral del billón de dólares en valoración. VAST, su startup de modelos de inteligencia artificial para contenido tridimensional, acaba de convertirse en unicornio. El anuncio llega apenas tres meses después de que la compañía cerrara su Serie A con $50 millones liderada por Alibaba y Hengxu Capital. El ritmo de esa secuencia —$50 millones en marzo, $200 millones en junio— no es solo una señal de tracción operativa. Es una señal sobre qué clase de apuesta están haciendo los inversores en este momento y por qué el 3D generativo ocupa ese lugar.

Song apareció este año en la lista Forbes 30 Under 30 Asia. Antes de fundar VAST en 2023 había trabajado como asistente del cofundador de SenseTime y había sido cofundador de MiniMax, otra firma de modelos de IA. Su plataforma Tripo AI convierte texto e imágenes en objetos tridimensionales detallados en segundos. Los clientes incluyen a NetEase, el gigante chino del videojuego, y a Sony. La base de usuarios asciende a 20 millones de personas en todo el mundo, con presencia especial en Estados Unidos, Europa y Japón. Las suscripciones van de $20 a $140 mensuales. Los proyectos empresariales se facturan por separado. Con ese anuncio de financiamiento vino también el lanzamiento del Proyecto Eden: un programa para construir modelos de mundo, es decir, sistemas de IA capaces de generar entornos virtuales que múltiples usuarios puedan explorar e interactuar.

Ahí está el caso. Lo que merece atención no es el número en sí, sino la estructura de valor que ese número revela —y las tensiones que todavía no se ven desde afuera.

El 3D como infraestructura, no como producto

La generación de imágenes por IA llegó primero porque el problema era más barato de resolver: datos abundantes, output verificable al instante, demanda masiva de creadores individuales. El 3D tomó más tiempo porque los requisitos computacionales son superiores, los datos de entrenamiento más escasos y la cadena de uso más compleja. Transformar un prompt en texto es una cosa. Transformarlo en un objeto tridimensional navegable, con proporciones físicas coherentes y calidad suficiente para producción en tiempo real, es otro orden de dificultad.

Esa dificultad es precisamente lo que hace que el segmento sea atractivo para capital de crecimiento. Cuando un problema técnico es genuinamente difícil y la demanda está claramente formada, quien lo resuelve primero con escala tiene una ventaja que no se replica en semanas. La creación de activos 3D representa hoy uno de los cuellos de botella más costosos en la producción de videojuegos, simulaciones industriales, experiencias de realidad aumentada y gemelos digitales para manufactura. Un estudio de desarrollo de videojuegos de tamaño mediano puede gastar entre el 30% y el 50% de su presupuesto de producción solo en arte y modelado 3D. Comprimir ese costo con IA no es una mejora incremental: es una reconversión de la estructura de gastos del negocio.

Lo que VAST está posicionando con Tripo AI es, en su lógica más profunda, una capa de infraestructura para la creación de contenido tridimensional. No un producto de nicho para diseñadores avanzados, sino una plataforma que puede integrarse en los flujos de producción de estudios de videojuegos, firmas de diseño industrial, plataformas de comercio electrónico y simuladores de entrenamiento. Cuando una startup tiene 20 millones de usuarios y clientes como NetEase y Sony en los primeros dos o tres años de existencia, la señal es que encontró demanda en capas simultáneas: el creador individual que paga $20 al mes y la corporación que paga por proyecto. Esa doble cara del modelo de ingresos es importante porque reduce la dependencia de un solo canal y distribuye el riesgo de churn.

El Proyecto Eden eleva la apuesta en una dirección específica: los modelos de mundo. Fei-Fei Li recaudó $1.000 millones para World Labs en ese mismo segmento a principios de este año. El movimiento de VAST hacia esa misma dirección, con una escala de capital menor pero con una plataforma operativa ya desplegada, sugiere que la compañía apuesta a que la ventaja competitiva futura no estará solo en generar objetos 3D sino en generar entornos completos y navegables, lo que cambia radicalmente la escala del mercado objetivo.

Dónde está el capital y qué incentivos lo mueven

Los inversores en esta ronda incluyen a INCE Capital, Genesis Capital y Primavera Capital Group. No son fondos generalistas. Son actores con exposición profunda al ecosistema tecnológico chino y con capacidad de acompañar rondas de crecimiento hacia escala. La participación previa de Alibaba en la Serie A no es decorativa: Alibaba tiene interés directo en que existan herramientas de generación de contenido 3D que puedan integrarse con sus plataformas de comercio, sus servicios en la nube y sus proyectos de entretenimiento.

Eso plantea una pregunta de estructura que vale la pena examinar con cuidado. Cuando un inversor estratégico como Alibaba entra en una ronda temprana y luego la compañía cierra una ronda de seguimiento de cuatro veces ese tamaño, hay dos lecturas posibles. La primera es que la tracción fue tan clara que los nuevos inversores financieros entraron con convicción independiente. La segunda es que el respaldo de Alibaba funcionó como señal de legitimidad que facilitó el cierre con otros fondos. Ambas lecturas pueden ser simultáneamente ciertas, y la distinción importa porque define qué tan autónoma es la trayectoria de VAST respecto de sus inversores estratégicos.

El detalle sobre la valoración es igualmente revelador. Según dos personas con conocimiento de la operación, la valoración supera los $1.000 millones; una de ellas la sitúa cerca de $1.500 millones. El hecho de que VAST no confirme públicamente su valoración es una práctica habitual en startups en etapa de crecimiento, pero también refleja que la empresa prefiere mantener flexibilidad en cómo se presenta al mercado. Con $250 millones acumulados en dos rondas durante el mismo año, el capital disponible para desplegar es sustancial. La compañía anunció que lo usará en contratación e investigación y desarrollo.

Ese destino de los fondos tiene una lógica clara: en IA generativa, el margen de ventaja se construye en la calidad del modelo y en la capacidad de iterarlo más rápido que los competidores. Contratar equipos de investigación de alto nivel en China es más barato que en Silicon Valley, lo que convierte cada dólar en mayor densidad de talento. Pero esa ventaja tiene un límite conocido: la disponibilidad de chips de entrenamiento avanzados, que en China opera bajo restricciones de exportación impuestas por el gobierno de Estados Unidos. Cómo VAST resuelve ese cuello de botella computacional sin acceso irrestricto a las GPU más potentes del mercado es una variable que los inversores conocen y que el mercado externo no puede leer con claridad.

La fragilidad que el éxito todavía oculta

El modelo de ingresos de VAST combina suscripciones individuales y facturación empresarial por proyecto. Eso es estructuralmente sano: los ingresos recurrentes de 20 millones de usuarios generan una base predecible, mientras que los contratos corporativos con estudios como NetEase y Sony aportan volumen por operación. Sin embargo, hay una tensión de fondo que merece atención antes de que la narrativa del unicornio la tape.

Las plataformas de herramientas para creadores y para empresas viven en lógicas diferentes. El usuario individual paga por utilidad inmediata y cambia de herramienta cuando aparece algo mejor o más barato. La empresa paga por integración, soporte y garantía de continuidad, pero también negocia precios y puede desarrollar capacidades internas si la herramienta se vuelve suficientemente madura. Lo que hoy parece una ventaja —que la plataforma sirva a ambos segmentos— puede convertirse en una tensión de producto si las necesidades divergen.

El segmento empresarial exige modelos más controlables, auditables, integrables con pipelines existentes y con SLAs bien definidos. El segmento de creadores individuales exige velocidad, simplicidad y precio. Mantener ambos en una sola plataforma requiere una arquitectura de producto que no siempre escala de forma limpia. Muchas plataformas de software han fracasado precisamente en ese punto: al crecer, la complejidad de servir a dos segmentos con lógicas distintas consume recursos de ingeniería y fragmenta la propuesta de valor hasta hacerla difusa.

Hay además una variable competitiva que la narrativa de la ronda no menciona explícitamente pero que define el horizonte del sector. Los grandes motores de videojuegos —Unity y Unreal Engine en particular— están invirtiendo activamente en capacidades de generación procedural y asistida por IA para activos 3D. Si esas plataformas, que ya tienen integración nativa en los flujos de producción de los estudios, desarrollan herramientas de generación 3D comparables a Tripo AI, la posición de VAST como capa independiente se complica. No porque VAST desaparezca, sino porque el espacio de negociación sobre dónde se captura el valor en la cadena se redistribuye.

El Proyecto Eden es la respuesta implícita a ese riesgo. Al moverse hacia modelos de mundo completos —entornos navegables con lógica física, múltiples usuarios y generación dinámica— VAST apunta a un nivel de complejidad que los motores de juego no van a resolver en el corto plazo como función nativa. Es una apuesta por construir el problema más difícil antes de que la competencia llegue a resolver el fácil.

Lo que $200 millones no compran solos

El reparto de valor en este modelo tiene, por ahora, una geometría razonable. Los usuarios individuales reciben utilidad real a precios accesibles. Los clientes corporativos reciben reducción de costos de producción en un cuello de botella genuino. Los inversores reciben exposición a un segmento de IA con demanda estructural y con tracción demostrada. VAST captura ingresos en dos capas y acumula datos de uso que retroalimentan la mejora del modelo. La lógica distributiva, tal como está, no muestra signos evidentes de extracción en una sola dirección.

Pero los $200 millones no compran autonomía sobre el entorno competitivo, acceso garantizado a infraestructura computacional bajo restricciones geopolíticas ni la capacidad de mantener simultáneamente la calidad para el creador individual y la robustez para el cliente corporativo. Tampoco compran tiempo indefinido: en modelos de suscripción para herramientas de IA, la tasa de abandono responde directamente a la velocidad con que aparecen alternativas. El capital solo compra la posibilidad de resolver esos problemas antes de que se vuelvan costosos. VAST tiene esa posibilidad. Si la ejecuta bien, el unicornio de hoy puede convertirse en la infraestructura del contenido 3D de la próxima década. Si no, los $200 millones serán el techo, no el trampolín.

Compartir

También te puede interesar