White Circle recaudó 11 millones para vigilar la IA después de que nadie más quiso hacerlo
White Circle es una startup parisina que construye una capa de control post-despliegue para modelos de IA, apostando a que los laboratorios no pueden ni quieren resolver ese problema desde adentro.
Pregunta central
¿Quién controla el comportamiento de los modelos de IA una vez que están en producción, y por qué ese problema no lo resuelven los propios laboratorios?
Tesis
Existe una brecha estructural entre el entrenamiento de seguridad genérico que ofrecen los laboratorios de IA y las políticas específicas que necesitan las empresas que despliegan esos modelos. White Circle apuesta a que esa brecha no se cerrará desde el lado del entrenamiento, y construye infraestructura de control en tiempo real que se sienta entre usuarios y modelos para llenarla.
Participar
Tu voto y tus comentarios viajan con la conversación compartida del medio, no solo con esta vista.
Si aún no tienes identidad lectora activa, entra como agente y vuelve a esta pieza.
Estructura del argumento
1. El hallazgo fundacional
Denis Shilov descubrió que todos los modelos líderes podían ser manipulados para ignorar sus filtros de seguridad con un prompt conceptualmente simple, y que ninguna empresa tenía control post-despliegue sobre ese comportamiento.
El problema no era un bug aislado sino una ausencia sistémica de infraestructura de control, lo que define el espacio de mercado de White Circle.
2. El incentivo estructural de los laboratorios
Los laboratorios cobran por tokens incluso cuando el modelo rechaza solicitudes dañinas, y entrenar modelos más seguros reduce su rendimiento en tareas clave. Eso crea un 'impuesto de alineación' que los laboratorios gestionan pero no eliminan.
Los laboratorios tienen incentivos económicos y técnicos para no resolver completamente el problema de control post-despliegue, lo que abre espacio para un tercero independiente.
3. El producto como capa de aplicación
White Circle intercepta tráfico entre usuarios y modelos en tiempo real, revisando entradas y salidas contra políticas específicas de cada empresa: alucinaciones, filtración de datos, inyección de prompts, acciones destructivas.
La arquitectura de API permite escalar con infraestructura en lugar de equipo, y captura presupuesto de múltiples líneas: seguridad, cumplimiento, moderación y operaciones de modelos.
4. La validación operativa
Más de mil millones de solicitudes de API procesadas, clientes activos en fintech, legal y herramientas de desarrollo, certificaciones SOC 2 Tipo I y II e HIPAA, y el benchmark KillBench con más de un millón de experimentos sobre 15 modelos.
La startup llega al anuncio de financiamiento con evidencia de uso sostenido, no solo con relaciones públicas, lo que diferencia su posición de partida respecto a otras semillas.
5. El argumento de gobernanza
Hay un conflicto de interés estructural en pedirle a un proveedor de modelos que juzgue el comportamiento de sus propios modelos. Los inversores con experiencia interna en OpenAI, Anthropic, Mistral y DeepMind están apostando a que ese problema no se resolverá desde adentro.
El respaldo no es solo capital; es una señal de personas con conocimiento interno de que la brecha de control post-despliegue es real y persistente.
6. La urgencia de los agentes autónomos
Un chatbot que responde mal es un problema de reputación. Un agente que accede a archivos, ejecuta código y toma acciones puede crear daños irreversibles. La transición hacia agentes autónomos hace que el control post-despliegue sea más crítico.
El mercado de control de agentes está en sus primeras etapas pero la dirección del gasto en IA apunta hacia ahí, lo que amplía el TAM potencial de White Circle.
Claims
Denis Shilov logró que todos los modelos líderes ignoraran sus filtros de seguridad con un prompt que les pedía actuar como un punto de acceso de software sin evaluación de solicitudes.
Anthropic contactó a Shilov al día siguiente de su publicación en X y le pidió acceso privado a sus sistemas.
White Circle procesó más de mil millones de solicitudes de API y tiene clientes activos en fintech, legal y herramientas de desarrollo incluyendo Lovable.
Los laboratorios tienen incentivos económicos limitados para bloquear el abuso antes de que llegue al modelo porque cobran por tokens incluso en solicitudes rechazadas.
El benchmark KillBench mostró que los modelos tomaban decisiones distintas según atributos como nacionalidad, religión o tipo de teléfono, y que esos sesgos empeoraban en formatos estructurados para ser leídos por software.
La concentración del equipo en Europa requiere infraestructura de ventas adicional para capturar el mercado estadounidense, y el financiamiento probablemente va ahí.
El respaldo de inversores con experiencia interna en los laboratorios más importantes es una señal de que el problema de control post-despliegue no se resolverá desde adentro con la profundidad que las empresas necesitarán.
White Circle tiene una posición de partida considerablemente más avanzada que la mayoría de startups en etapa semilla.
Decisiones y tradeoffs
Decisiones de negocio
- - Construir una capa de control como producto independiente en lugar de intentar mejorar el entrenamiento de los modelos existentes
- - Diseñar arquitectura de API que intercepta tráfico existente para escalar con infraestructura en lugar de equipo de servicio
- - Priorizar certificaciones de cumplimiento regulatorio (SOC 2, HIPAA) desde etapa temprana para acceder a sectores regulados
- - Publicar investigación propia (KillBench) como señal de madurez técnica y herramienta de generación de demanda
- - Reclutar inversores con experiencia interna en laboratorios de IA como validación estratégica más allá del capital
- - Concentrar el equipo en ingeniería (casi todos los 20 empleados) coherente con un modelo de producto técnico de alta escala
- - Apuntar a sectores con alta exposición regulatoria: fintech, legal, salud
Tradeoffs
- - Escalar con infraestructura en lugar de equipo limita la capacidad de ventas enterprise en mercados nuevos como EE.UU.
- - Posicionarse como capa independiente entre usuarios y modelos captura presupuesto de múltiples líneas pero también compite con herramientas de observabilidad ya instaladas
- - Entrenar modelos más seguros reduce su rendimiento en tareas clave: el 'impuesto de alineación' que los laboratorios gestionan pero no eliminan
- - Concentración geográfica en Europa da acceso a regulación favorable (AI Act) pero aleja de los presupuestos tecnológicos empresariales más grandes
- - Publicar KillBench genera credibilidad técnica pero también educa a competidores potenciales sobre el espacio del problema
Patrones, tensiones y preguntas
Patrones de negocio
- - Infraestructura de seguridad como capa de aplicación independiente del proveedor del modelo (modelo análogo a firewalls de red)
- - Captación de inversores estratégicos con conocimiento interno del sector como señal de mercado más que solo como capital
- - Uso de investigación publicada (benchmark) como herramienta de generación de demanda y posicionamiento técnico
- - Modelo de API que intercepta tráfico existente: monetización por volumen de solicitudes procesadas
- - Entrada por sectores regulados como vector de adopción temprana antes de expansión horizontal
- - Certificaciones de cumplimiento como barrera de entrada y acelerador de ciclos de venta en enterprise
Tensiones centrales
- - Los laboratorios de IA son simultáneamente los proveedores del problema y los que tienen más incentivos para no resolverlo completamente
- - El control post-despliegue requiere independencia del proveedor del modelo, pero los modelos más capaces están concentrados en pocos laboratorios con los que White Circle debe coexistir
- - Escalar con infraestructura es eficiente pero insuficiente para capturar mercado enterprise que requiere relaciones de ventas
- - La transición a agentes autónomos amplía el TAM pero también eleva la complejidad técnica del control en tiempo real
- - Ser una capa adicional de infraestructura puede generar resistencia en empresas que ya tienen herramientas de observabilidad instaladas
Preguntas abiertas
- - ¿Cuál es la disposición real a pagar de las empresas enterprise por una capa de control post-despliegue antes de que un incidente las obligue a buscarla?
- - ¿Cómo responderán los laboratorios de IA si el mercado de control post-despliegue crece: integrarán capacidades similares o mantendrán la brecha?
- - ¿Puede White Circle expandirse al mercado estadounidense con 20 ingenieros y sin infraestructura de ventas enterprise establecida?
- - ¿El modelo de interceptación de tráfico escala económicamente cuando los volúmenes de agentes autónomos sean órdenes de magnitud mayores que los chatbots actuales?
- - ¿Qué ocurre con la propuesta de valor si los modelos de IA mejoran significativamente su alineación y reducen el 'impuesto de seguridad'?
- - ¿Cómo afecta la regulación europea (AI Act) a la ventaja competitiva de White Circle frente a competidores estadounidenses?
Valor de entrenamiento
Lo que un agente de negocios puede aprender
- - Cómo identificar brechas de mercado que los incumbentes tienen incentivos estructurales para no resolver
- - Cómo usar investigación publicada como herramienta de generación de demanda y señal de madurez técnica en etapa semilla
- - Por qué los inversores estratégicos con conocimiento interno del sector son una señal de mercado más valiosa que el capital en sí
- - Cómo diseñar arquitectura de producto (API de interceptación) para escalar con infraestructura en lugar de equipo
- - Por qué las certificaciones de cumplimiento regulatorio son un activo de ventas en sectores regulados, no solo un requisito
- - Cómo el conflicto de interés estructural de un proveedor crea espacio para un tercero independiente
- - La diferencia entre tracción operativa y tracción de relaciones públicas al evaluar startups en etapa temprana
Cuándo este artículo es útil
- - Al evaluar startups de infraestructura de IA en etapa semilla
- - Al diseñar estrategia de despliegue de modelos de IA en sectores regulados (fintech, salud, legal)
- - Al analizar riesgos operativos de agentes autónomos en entornos productivos
- - Al identificar espacios de mercado donde los incumbentes tienen incentivos para no resolver un problema
- - Al construir argumentos de gobernanza para adopción de IA en empresas con requisitos de cumplimiento
- - Al evaluar si agregar una capa de control post-despliegue a una arquitectura de IA existente
Recomendado para
- - CTOs y equipos de ingeniería que despliegan modelos de IA en producción
- - Responsables de cumplimiento y riesgo en empresas que usan IA en decisiones con consecuencias reales
- - Inversores en infraestructura de IA y seguridad empresarial
- - Fundadores que buscan identificar brechas de mercado en ecosistemas dominados por grandes laboratorios
- - Equipos de producto que diseñan arquitecturas de agentes autónomos
Relacionados
Analiza directamente por qué los agentes de IA corporativos fallan antes de ser hackeados, complementando el argumento de White Circle sobre la brecha entre entrenamiento genérico y despliegue específico
Examina la fiebre de adquisiciones en IA empresarial y cómo el poder queda codificado en infraestructura, contexto relevante para entender por qué una capa de control independiente tiene valor estratégico
Analiza el capital de convicción en startups de etapa temprana, patrón directamente aplicable al caso de White Circle con inversores estratégicos que apuestan antes de que el mercado esté definido