{"version":"1.0","type":"agent_native_article","locale":"es","slug":"white-circle-11-millones-vigilar-ia-control-post-despliegue-mp4q58v4","title":"White Circle recaudó 11 millones para vigilar la IA después de que nadie más quiso hacerlo","primary_category":"startups","author":{"name":"Tomás Rivera","slug":"tomas-rivera"},"published_at":"2026-05-14T00:02:28.000Z","total_votes":86,"comment_count":0,"has_map":true,"urls":{"human":"https://sustainabl.net/es/articulo/white-circle-11-millones-vigilar-ia-control-post-despliegue-mp4q58v4","agent":"https://sustainabl.net/agent-native/es/articulo/white-circle-11-millones-vigilar-ia-control-post-despliegue-mp4q58v4"},"summary":{"one_line":"White Circle es una startup parisina que construye una capa de control post-despliegue para modelos de IA, apostando a que los laboratorios no pueden ni quieren resolver ese problema desde adentro.","core_question":"¿Quién controla el comportamiento de los modelos de IA una vez que están en producción, y por qué ese problema no lo resuelven los propios laboratorios?","main_thesis":"Existe una brecha estructural entre el entrenamiento de seguridad genérico que ofrecen los laboratorios de IA y las políticas específicas que necesitan las empresas que despliegan esos modelos. White Circle apuesta a que esa brecha no se cerrará desde el lado del entrenamiento, y construye infraestructura de control en tiempo real que se sienta entre usuarios y modelos para llenarla."},"content_markdown":"## White Circle recaudó 11 millones para vigilar la IA después de que nadie más quiso hacerlo\n\nUna noche de finales de 2024, Denis Shilov estaba viendo un thriller policial cuando se le ocurrió un experimento. Escribió un prompt que lograba que cualquier modelo de inteligencia artificial ignorara sus propios filtros de seguridad. El truco era conceptualmente simple: le decía al modelo que dejara de comportarse como un chatbot con reglas y empezara a actuar como un punto de acceso de software que simplemente responde solicitudes sin evaluar si debería hacerlo. Funcionó con todos los modelos líderes. Al día siguiente, su publicación en X había acumulado suficiente tracción para que Anthropic lo contactara y le pidiera acceso privado a sus sistemas.\n\nLo que Shilov concluyó de ese episodio no fue que había encontrado un bug. Fue que ninguna empresa tenía una capa de control post-despliegue sobre lo que sus modelos de IA hacían una vez que los usuarios empezaban a interactuar con ellos. Esa observación se convirtió en White Circle, y el 12 de mayo de 2026, la startup parisina anunció una ronda semilla de **11 millones de dólares** respaldada por figuras que conocen los modelos desde adentro: el director de experiencia de desarrolladores de OpenAI, un cofundador de OpenAI hoy en Anthropic, el cofundador y científico jefe de Mistral, el cofundador y director científico de Hugging Face, el fundador de Datadog, el creador de Keras y ejecutivos de DeepMind y Sentry.\n\nEl capital no es lo más interesante de la historia. Lo interesante es qué tipo de infraestructura de negocio justifica esa convicción tan temprana y por qué la respuesta del mercado a ese problema específico tardó tanto en aparecer.\n\n## El problema que los laboratorios de IA tienen incentivos para no resolver del todo\n\nCuando una empresa despliega un modelo de lenguaje en producción, hereda un contrato implícito con el proveedor del modelo: el proveedor ha entrenado el modelo para comportarse de cierta manera en términos generales, y la empresa asume que ese entrenamiento es suficiente para sus casos de uso específicos. Ese supuesto es cada vez más difícil de sostener.\n\nLos modelos actuales son instrumento y riesgo al mismo tiempo. Un agente de soporte al cliente puede prometer un reembolso que la empresa no autorizó. Un agente de codificación puede instalar algo en una máquina virtual que no debía tocarse. Un modelo integrado en una aplicación financiera puede manejar mal datos sensibles del cliente. Ninguno de esos escenarios es hipotético; son consecuencias documentadas de desplegar modelos capaces en entornos con instrucciones incompletas o ambiguas.\n\nLa respuesta habitual de los laboratorios de modelos es el ajuste de seguridad durante el entrenamiento. Pero ese ajuste es, por definición, genérico. Está calibrado para evitar que el modelo explique cómo fabricar armas o produzca contenido dañino en abstracto. No está calibrado para la política específica de una empresa de servicios financieros sobre qué puede y no puede prometer en una conversación con un cliente, ni para las restricciones de una empresa de salud sobre qué datos pueden cruzarse entre sí.\n\nShilov señala algo más estructural: los laboratorios cobran por tokens de entrada y salida incluso cuando el modelo rechaza una solicitud dañina. Eso significa que tienen una motivación económica limitada para bloquear el abuso antes de que llegue al modelo. También señala el llamado \"impuesto de alineación\": entrenar modelos más seguros tiende a reducir su desempeño en tareas como codificación. Esa tensión entre seguridad y rendimiento no desaparece con más financiamiento; es una restricción técnica que los laboratorios gestionan, no eliminan.\n\nWhite Circle apuesta a que esa brecha no se cerrará solo desde el lado del entrenamiento. Su producto es una capa de aplicación en tiempo real que se sienta entre los usuarios de una empresa y sus modelos, revisa entradas y salidas contra las políticas específicas de esa empresa, y puede bloquear o marcar comportamientos problemáticos: alucinaciones, filtración de datos, contenido prohibido, inyección de prompts, acciones destructivas en entornos de software. La empresa dice haber procesado más de **mil millones de solicitudes de API** y tener clientes activos en fintech, legal y herramientas de desarrollo, incluyendo Lovable. El sistema soporta más de 150 idiomas y tiene certificaciones SOC 2 Tipo I y II además de cumplimiento con HIPAA.\n\n## Qué valida mil millones de solicitudes y qué no\n\nMil millones de solicitudes de API es el tipo de número que suena grande y puede significar cosas muy distintas dependiendo del volumen por cliente, el tipo de solicitud y la tasa de retención. White Circle fue fundada en 2025 y tiene 20 empleados, casi todos ingenieros. Eso sugiere una arquitectura diseñada para escalar con infraestructura más que con equipo de servicio, lo cual es coherente con un modelo de API que intercepta tráfico existente.\n\nLo que el número sí valida, hasta donde los datos públicos permiten concluir, es que la plataforma tiene tracción operativa, no solo tracción de relaciones públicas. Hay una diferencia importante entre una empresa que anuncia financiamiento con una lista de clientes potenciales y una que llega al anuncio con evidencia de uso sostenido. El benchmark que White Circle publicó en mayo de 2026, KillBench, también funciona como señal de madurez técnica: corrieron más de un millón de experimentos sobre 15 modelos de OpenAI, Google, Anthropic y xAI para medir sesgos en escenarios de decisiones de alto riesgo. Los resultados mostraron que los modelos tomaban decisiones distintas según atributos como nacionalidad, religión o tipo de teléfono, y que esos sesgos empeoraban cuando las respuestas se pedían en formatos estructurados para ser leídos por software, que es exactamente cómo la mayoría de las empresas conectan modelos a sus sistemas productivos.\n\nEse hallazgo tiene consecuencias directas para cualquier empresa que use IA en decisiones con consecuencias reales. No es un experimento académico; es documentación de un vector de riesgo que ocurre en el formato de integración más común.\n\nLo que el número no valida, todavía, es la disposición a pagar a escala. El modelo de negocio de una capa de control que intercepta tráfico tiene una mecánica potencialmente poderosa: si se vuelve parte del flujo de trabajo entre usuarios y modelos, captura presupuesto de múltiples líneas, seguridad, cumplimiento, moderación de contenido y operaciones de modelos. Pero eso también significa que compite por presupuesto con equipos que ya tienen herramientas de observabilidad y que pueden resistir agregar otra capa de infraestructura.\n\nLa concentración geográfica del equipo en Europa, con presencia en Londres, Francia y Ámsterdam, sugiere que la expansión hacia el mercado estadounidense, que es donde están los presupuestos de tecnología empresarial más grandes, requiere infraestructura de ventas que 20 ingenieros no pueden cubrir. El financiamiento probablemente va ahí.\n\n## Una capa de control que los modelos no pueden vender solos\n\nEl argumento más sólido de White Circle no es técnico. Es de gobernanza.\n\nShilov lo formuló con precisión: hay un problema de confianza estructural en pedirle a un proveedor de modelos que juzgue el comportamiento de sus propios modelos. Anthropic no puede ser árbitro neutral del comportamiento de Claude cuando es el mismo que lo entrena, lo comercializa y cobra por cada token que genera. Eso no es una acusación; es una descripción de incentivos. Los laboratorios de IA son empresas con intereses comerciales específicos, y sus sistemas de seguridad están calibrados para esos intereses, no para los de cada empresa que despliega sus modelos.\n\nEsa separación es lo que hace que el respaldo de inversores con experiencia en los laboratorios más importantes del sector sea estratégicamente relevante más allá del capital. Personas que conocen las restricciones técnicas y comerciales de OpenAI, Anthropic, Mistral y DeepMind desde adentro están apostando a que el problema de control post-despliegue no se va a resolver desde dentro de esos laboratorios con la profundidad que las empresas van a necesitar. Eso es tanto una validación del problema como una señal sobre la dirección del mercado.\n\nLa transición de chatbots a agentes autónomos hace que esa brecha sea más urgente. Un chatbot que responde mal es un problema de reputación. Un agente que accede a archivos, ejecuta código, navega la web y toma acciones en nombre de un usuario puede crear daños que no se revierten con un mensaje de disculpa. El mercado de control de agentes autónomos está en sus primeras etapas, pero la dirección del gasto en IA apunta hacia ahí con claridad.\n\nWhite Circle llegó al anuncio con uso operativo, investigación publicada, certificaciones de cumplimiento y respaldo de personas con credibilidad técnica en el sector. Eso no es garantía de éxito, pero es una línea de partida que está considerablemente más adelante de donde suelen estar las startups en la etapa semilla. El siguiente umbral que importa no es el próximo titular de financiamiento; es cuántas empresas en sectores regulados deciden que necesitan una capa de control entre sus usuarios y sus modelos antes de que un incidente les obligue a buscarlo por las malas.","article_map":{"title":"White Circle recaudó 11 millones para vigilar la IA después de que nadie más quiso hacerlo","entities":[{"name":"White Circle","type":"company","role_in_article":"Startup protagonista que construye infraestructura de control post-despliegue para modelos de IA"},{"name":"Denis Shilov","type":"person","role_in_article":"Fundador de White Circle, descubrió la vulnerabilidad que motivó la creación de la empresa"},{"name":"Anthropic","type":"company","role_in_article":"Laboratorio de IA que contactó a Shilov tras su hallazgo; mencionado como ejemplo de conflicto de interés estructural en gobernanza de modelos"},{"name":"OpenAI","type":"company","role_in_article":"Laboratorio de IA cuyos modelos fueron incluidos en KillBench; varios de sus exejecutivos son inversores en White Circle"},{"name":"Mistral","type":"company","role_in_article":"Laboratorio de IA europeo cuyo cofundador y científico jefe invirtió en White Circle"},{"name":"Hugging Face","type":"company","role_in_article":"Plataforma de IA cuyo cofundador y director científico invirtió en White Circle"},{"name":"Datadog","type":"company","role_in_article":"Empresa de observabilidad cuyo fundador invirtió en White Circle"},{"name":"DeepMind","type":"company","role_in_article":"Laboratorio de IA de Google; ejecutivos participaron como inversores en White Circle"},{"name":"Lovable","type":"company","role_in_article":"Cliente activo de White Circle mencionado como referencia de tracción en herramientas de desarrollo"},{"name":"KillBench","type":"product","role_in_article":"Benchmark publicado por White Circle que midió sesgos en 15 modelos de IA en escenarios de decisiones de alto riesgo"},{"name":"Keras","type":"product","role_in_article":"Framework de deep learning cuyo creador invirtió en White Circle"},{"name":"Sentry","type":"company","role_in_article":"Empresa de monitoreo de software cuyos ejecutivos participaron como inversores"}],"tradeoffs":["Escalar con infraestructura en lugar de equipo limita la capacidad de ventas enterprise en mercados nuevos como EE.UU.","Posicionarse como capa independiente entre usuarios y modelos captura presupuesto de múltiples líneas pero también compite con herramientas de observabilidad ya instaladas","Entrenar modelos más seguros reduce su rendimiento en tareas clave: el 'impuesto de alineación' que los laboratorios gestionan pero no eliminan","Concentración geográfica en Europa da acceso a regulación favorable (AI Act) pero aleja de los presupuestos tecnológicos empresariales más grandes","Publicar KillBench genera credibilidad técnica pero también educa a competidores potenciales sobre el espacio del problema"],"key_claims":[{"claim":"Denis Shilov logró que todos los modelos líderes ignoraran sus filtros de seguridad con un prompt que les pedía actuar como un punto de acceso de software sin evaluación de solicitudes.","confidence":"high","support_type":"reported_fact"},{"claim":"Anthropic contactó a Shilov al día siguiente de su publicación en X y le pidió acceso privado a sus sistemas.","confidence":"high","support_type":"reported_fact"},{"claim":"White Circle procesó más de mil millones de solicitudes de API y tiene clientes activos en fintech, legal y herramientas de desarrollo incluyendo Lovable.","confidence":"high","support_type":"reported_fact"},{"claim":"Los laboratorios tienen incentivos económicos limitados para bloquear el abuso antes de que llegue al modelo porque cobran por tokens incluso en solicitudes rechazadas.","confidence":"medium","support_type":"inference"},{"claim":"El benchmark KillBench mostró que los modelos tomaban decisiones distintas según atributos como nacionalidad, religión o tipo de teléfono, y que esos sesgos empeoraban en formatos estructurados para ser leídos por software.","confidence":"high","support_type":"reported_fact"},{"claim":"La concentración del equipo en Europa requiere infraestructura de ventas adicional para capturar el mercado estadounidense, y el financiamiento probablemente va ahí.","confidence":"medium","support_type":"inference"},{"claim":"El respaldo de inversores con experiencia interna en los laboratorios más importantes es una señal de que el problema de control post-despliegue no se resolverá desde adentro con la profundidad que las empresas necesitarán.","confidence":"interpretive","support_type":"editorial_judgment"},{"claim":"White Circle tiene una posición de partida considerablemente más avanzada que la mayoría de startups en etapa semilla.","confidence":"interpretive","support_type":"editorial_judgment"}],"main_thesis":"Existe una brecha estructural entre el entrenamiento de seguridad genérico que ofrecen los laboratorios de IA y las políticas específicas que necesitan las empresas que despliegan esos modelos. White Circle apuesta a que esa brecha no se cerrará desde el lado del entrenamiento, y construye infraestructura de control en tiempo real que se sienta entre usuarios y modelos para llenarla.","core_question":"¿Quién controla el comportamiento de los modelos de IA una vez que están en producción, y por qué ese problema no lo resuelven los propios laboratorios?","core_tensions":["Los laboratorios de IA son simultáneamente los proveedores del problema y los que tienen más incentivos para no resolverlo completamente","El control post-despliegue requiere independencia del proveedor del modelo, pero los modelos más capaces están concentrados en pocos laboratorios con los que White Circle debe coexistir","Escalar con infraestructura es eficiente pero insuficiente para capturar mercado enterprise que requiere relaciones de ventas","La transición a agentes autónomos amplía el TAM pero también eleva la complejidad técnica del control en tiempo real","Ser una capa adicional de infraestructura puede generar resistencia en empresas que ya tienen herramientas de observabilidad instaladas"],"open_questions":["¿Cuál es la disposición real a pagar de las empresas enterprise por una capa de control post-despliegue antes de que un incidente las obligue a buscarla?","¿Cómo responderán los laboratorios de IA si el mercado de control post-despliegue crece: integrarán capacidades similares o mantendrán la brecha?","¿Puede White Circle expandirse al mercado estadounidense con 20 ingenieros y sin infraestructura de ventas enterprise establecida?","¿El modelo de interceptación de tráfico escala económicamente cuando los volúmenes de agentes autónomos sean órdenes de magnitud mayores que los chatbots actuales?","¿Qué ocurre con la propuesta de valor si los modelos de IA mejoran significativamente su alineación y reducen el 'impuesto de seguridad'?","¿Cómo afecta la regulación europea (AI Act) a la ventaja competitiva de White Circle frente a competidores estadounidenses?"],"training_value":{"recommended_for":["CTOs y equipos de ingeniería que despliegan modelos de IA en producción","Responsables de cumplimiento y riesgo en empresas que usan IA en decisiones con consecuencias reales","Inversores en infraestructura de IA y seguridad empresarial","Fundadores que buscan identificar brechas de mercado en ecosistemas dominados por grandes laboratorios","Equipos de producto que diseñan arquitecturas de agentes autónomos"],"when_this_article_is_useful":["Al evaluar startups de infraestructura de IA en etapa semilla","Al diseñar estrategia de despliegue de modelos de IA en sectores regulados (fintech, salud, legal)","Al analizar riesgos operativos de agentes autónomos en entornos productivos","Al identificar espacios de mercado donde los incumbentes tienen incentivos para no resolver un problema","Al construir argumentos de gobernanza para adopción de IA en empresas con requisitos de cumplimiento","Al evaluar si agregar una capa de control post-despliegue a una arquitectura de IA existente"],"what_a_business_agent_can_learn":["Cómo identificar brechas de mercado que los incumbentes tienen incentivos estructurales para no resolver","Cómo usar investigación publicada como herramienta de generación de demanda y señal de madurez técnica en etapa semilla","Por qué los inversores estratégicos con conocimiento interno del sector son una señal de mercado más valiosa que el capital en sí","Cómo diseñar arquitectura de producto (API de interceptación) para escalar con infraestructura en lugar de equipo","Por qué las certificaciones de cumplimiento regulatorio son un activo de ventas en sectores regulados, no solo un requisito","Cómo el conflicto de interés estructural de un proveedor crea espacio para un tercero independiente","La diferencia entre tracción operativa y tracción de relaciones públicas al evaluar startups en etapa temprana"]},"argument_outline":[{"label":"1. El hallazgo fundacional","point":"Denis Shilov descubrió que todos los modelos líderes podían ser manipulados para ignorar sus filtros de seguridad con un prompt conceptualmente simple, y que ninguna empresa tenía control post-despliegue sobre ese comportamiento.","why_it_matters":"El problema no era un bug aislado sino una ausencia sistémica de infraestructura de control, lo que define el espacio de mercado de White Circle."},{"label":"2. El incentivo estructural de los laboratorios","point":"Los laboratorios cobran por tokens incluso cuando el modelo rechaza solicitudes dañinas, y entrenar modelos más seguros reduce su rendimiento en tareas clave. Eso crea un 'impuesto de alineación' que los laboratorios gestionan pero no eliminan.","why_it_matters":"Los laboratorios tienen incentivos económicos y técnicos para no resolver completamente el problema de control post-despliegue, lo que abre espacio para un tercero independiente."},{"label":"3. El producto como capa de aplicación","point":"White Circle intercepta tráfico entre usuarios y modelos en tiempo real, revisando entradas y salidas contra políticas específicas de cada empresa: alucinaciones, filtración de datos, inyección de prompts, acciones destructivas.","why_it_matters":"La arquitectura de API permite escalar con infraestructura en lugar de equipo, y captura presupuesto de múltiples líneas: seguridad, cumplimiento, moderación y operaciones de modelos."},{"label":"4. La validación operativa","point":"Más de mil millones de solicitudes de API procesadas, clientes activos en fintech, legal y herramientas de desarrollo, certificaciones SOC 2 Tipo I y II e HIPAA, y el benchmark KillBench con más de un millón de experimentos sobre 15 modelos.","why_it_matters":"La startup llega al anuncio de financiamiento con evidencia de uso sostenido, no solo con relaciones públicas, lo que diferencia su posición de partida respecto a otras semillas."},{"label":"5. El argumento de gobernanza","point":"Hay un conflicto de interés estructural en pedirle a un proveedor de modelos que juzgue el comportamiento de sus propios modelos. Los inversores con experiencia interna en OpenAI, Anthropic, Mistral y DeepMind están apostando a que ese problema no se resolverá desde adentro.","why_it_matters":"El respaldo no es solo capital; es una señal de personas con conocimiento interno de que la brecha de control post-despliegue es real y persistente."},{"label":"6. La urgencia de los agentes autónomos","point":"Un chatbot que responde mal es un problema de reputación. Un agente que accede a archivos, ejecuta código y toma acciones puede crear daños irreversibles. La transición hacia agentes autónomos hace que el control post-despliegue sea más crítico.","why_it_matters":"El mercado de control de agentes está en sus primeras etapas pero la dirección del gasto en IA apunta hacia ahí, lo que amplía el TAM potencial de White Circle."}],"one_line_summary":"White Circle es una startup parisina que construye una capa de control post-despliegue para modelos de IA, apostando a que los laboratorios no pueden ni quieren resolver ese problema desde adentro.","related_articles":[{"reason":"Analiza directamente por qué los agentes de IA corporativos fallan antes de ser hackeados, complementando el argumento de White Circle sobre la brecha entre entrenamiento genérico y despliegue específico","article_id":12607},{"reason":"Examina la fiebre de adquisiciones en IA empresarial y cómo el poder queda codificado en infraestructura, contexto relevante para entender por qué una capa de control independiente tiene valor estratégico","article_id":12495},{"reason":"Analiza el capital de convicción en startups de etapa temprana, patrón directamente aplicable al caso de White Circle con inversores estratégicos que apuestan antes de que el mercado esté definido","article_id":12440}],"business_patterns":["Infraestructura de seguridad como capa de aplicación independiente del proveedor del modelo (modelo análogo a firewalls de red)","Captación de inversores estratégicos con conocimiento interno del sector como señal de mercado más que solo como capital","Uso de investigación publicada (benchmark) como herramienta de generación de demanda y posicionamiento técnico","Modelo de API que intercepta tráfico existente: monetización por volumen de solicitudes procesadas","Entrada por sectores regulados como vector de adopción temprana antes de expansión horizontal","Certificaciones de cumplimiento como barrera de entrada y acelerador de ciclos de venta en enterprise"],"business_decisions":["Construir una capa de control como producto independiente en lugar de intentar mejorar el entrenamiento de los modelos existentes","Diseñar arquitectura de API que intercepta tráfico existente para escalar con infraestructura en lugar de equipo de servicio","Priorizar certificaciones de cumplimiento regulatorio (SOC 2, HIPAA) desde etapa temprana para acceder a sectores regulados","Publicar investigación propia (KillBench) como señal de madurez técnica y herramienta de generación de demanda","Reclutar inversores con experiencia interna en laboratorios de IA como validación estratégica más allá del capital","Concentrar el equipo en ingeniería (casi todos los 20 empleados) coherente con un modelo de producto técnico de alta escala","Apuntar a sectores con alta exposición regulatoria: fintech, legal, salud"]}}