White Circle lève 11 millions pour surveiller l'IA après que personne d'autre ne voulait le faire

White Circle lève 11 millions pour surveiller l'IA après que personne d'autre ne voulait le faire

Un soir fin 2024, Denis Shilov regardait un thriller policier quand une idée lui traversa l'esprit. Il rédigea un prompt qui permettait à n'importe quel modèle d'intelligence artificielle d'ignorer ses propres filtres de sécurité. Ce que Shilov conclut de cet épisode n'était pas qu'il avait découvert un bug, mais qu'aucune entreprise ne disposait d'une couche de contrôle post-déploiement sur ce que ses modèles d'IA faisaient une fois que les utilisateurs commençaient à interagir avec eux.

Tomás RiveraTomás Rivera14 mai 20268 min
Partager

White Circle a levé 11 millions de dollars pour surveiller l'IA après que personne d'autre ne voulait le faire

Une nuit de fin 2024, Denis Shilov regardait un thriller policier lorsqu'une idée d'expérience lui traversa l'esprit. Il rédigea un prompt qui parvenait à amener n'importe quel modèle d'intelligence artificielle à ignorer ses propres filtres de sécurité. L'astuce était conceptuellement simple : elle consistait à dire au modèle de cesser de se comporter comme un chatbot doté de règles et de commencer à agir comme un point d'accès logiciel qui répond simplement aux requêtes sans évaluer s'il devrait le faire ou non. Cela fonctionnait avec tous les modèles leaders du marché. Le lendemain, sa publication sur X avait accumulé suffisamment de traction pour qu'Anthropic le contacte et lui demande un accès privé à ses systèmes.

Ce que Shilov conclut de cet épisode ne fut pas qu'il avait découvert un bug. Ce fut qu'aucune entreprise ne disposait d'une couche de contrôle post-déploiement sur ce que ses modèles d'IA faisaient une fois que les utilisateurs commençaient à interagir avec eux. Cette observation se transforma en White Circle, et le 12 mai 2026, la startup parisienne annonça une levée de fonds d'amorçage de 11 millions de dollars, soutenue par des personnalités qui connaissent les modèles de l'intérieur : le directeur de l'expérience développeurs d'OpenAI, un cofondateur d'OpenAI aujourd'hui chez Anthropic, le cofondateur et scientifique en chef de Mistral, le cofondateur et directeur scientifique de Hugging Face, le fondateur de Datadog, le créateur de Keras, ainsi que des dirigeants de DeepMind et Sentry.

Le capital n'est pas ce qu'il y a de plus intéressant dans cette histoire. Ce qui est intéressant, c'est quel type d'infrastructure commerciale justifie une conviction aussi précoce, et pourquoi la réponse du marché à ce problème spécifique a mis autant de temps à émerger.

Le problème que les laboratoires d'IA ont des incitations à ne pas résoudre entièrement

Lorsqu'une entreprise déploie un modèle de langage en production, elle hérite d'un contrat implicite avec le fournisseur du modèle : le fournisseur a entraîné le modèle à se comporter d'une certaine manière dans les grandes lignes, et l'entreprise suppose que cet entraînement est suffisant pour ses cas d'usage spécifiques. Cette hypothèse est de plus en plus difficile à maintenir.

Les modèles actuels sont à la fois un outil et un risque. Un agent de support client peut promettre un remboursement que l'entreprise n'a pas autorisé. Un agent de codage peut installer quelque chose sur une machine virtuelle qui n'aurait pas dû être touchée. Un modèle intégré dans une application financière peut mal gérer des données sensibles du client. Aucun de ces scénarios n'est hypothétique ; ce sont des conséquences documentées du déploiement de modèles capables dans des environnements avec des instructions incomplètes ou ambiguës.

La réponse habituelle des laboratoires de modèles est l'ajustement de sécurité lors de l'entraînement. Mais cet ajustement est, par définition, générique. Il est calibré pour empêcher le modèle d'expliquer comment fabriquer des armes ou de produire du contenu nuisible de manière abstraite. Il n'est pas calibré pour la politique spécifique d'une entreprise de services financiers quant à ce qu'elle peut ou ne peut pas promettre lors d'une conversation avec un client, ni pour les restrictions d'une entreprise de santé sur les données pouvant être croisées entre elles.

Shilov pointe quelque chose de plus structurel : les laboratoires facturent des tokens d'entrée et de sortie même lorsque le modèle rejette une requête nuisible. Cela signifie qu'ils ont une motivation économique limitée pour bloquer les abus avant qu'ils n'atteignent le modèle. Il souligne également ce que l'on appelle la « taxe d'alignement » : entraîner des modèles plus sûrs tend à réduire leurs performances sur des tâches comme la programmation. Cette tension entre sécurité et performance ne disparaît pas avec davantage de financement ; c'est une contrainte technique que les laboratoires gèrent, sans pour autant l'éliminer.

White Circle parie que cet écart ne se comblera pas uniquement du côté de l'entraînement. Son produit est une couche applicative en temps réel qui se place entre les utilisateurs d'une entreprise et ses modèles, examine les entrées et les sorties en les confrontant aux politiques spécifiques de cette entreprise, et peut bloquer ou signaler les comportements problématiques : hallucinations, fuite de données, contenu interdit, injection de prompts, actions destructrices dans des environnements logiciels. L'entreprise déclare avoir traité plus de un milliard de requêtes d'API et disposer de clients actifs dans la fintech, le domaine juridique et les outils de développement, dont Lovable. Le système prend en charge plus de 150 langues et dispose des certifications SOC 2 Type I et II, ainsi que de la conformité HIPAA.

Ce que valide un milliard de requêtes, et ce que cela ne valide pas

Un milliard de requêtes d'API est le genre de chiffre qui sonne grand et peut signifier des choses très différentes selon le volume par client, le type de requête et le taux de rétention. White Circle a été fondée en 2025 et compte 20 employés, presque tous des ingénieurs. Cela suggère une architecture conçue pour évoluer grâce à l'infrastructure plutôt qu'à une équipe de service, ce qui est cohérent avec un modèle d'API qui intercepte le trafic existant.

Ce que le chiffre valide effectivement, dans la mesure où les données publiques permettent de le conclure, c'est que la plateforme dispose d'une traction opérationnelle, et pas seulement d'une traction médiatique. Il y a une différence importante entre une entreprise qui annonce un financement avec une liste de clients potentiels et une qui arrive à l'annonce avec des preuves d'utilisation soutenue. Le benchmark que White Circle a publié en mai 2026, KillBench, fonctionne également comme un signal de maturité technique : l'entreprise a mené plus d'un million d'expériences sur 15 modèles d'OpenAI, Google, Anthropic et xAI pour mesurer les biais dans des scénarios de décisions à enjeux élevés. Les résultats ont montré que les modèles prenaient des décisions différentes selon des attributs comme la nationalité, la religion ou le type de téléphone, et que ces biais s'aggravaient lorsque les réponses étaient demandées dans des formats structurés destinés à être lus par des logiciels, ce qui est exactement la façon dont la plupart des entreprises connectent leurs modèles à leurs systèmes de production.

Cette découverte a des conséquences directes pour toute entreprise utilisant l'IA dans des décisions aux répercussions réelles. Il ne s'agit pas d'une expérience académique ; c'est la documentation d'un vecteur de risque qui se manifeste dans le format d'intégration le plus courant.

Ce que le chiffre ne valide pas encore, c'est la volonté de payer à grande échelle. Le modèle économique d'une couche de contrôle qui intercepte le trafic a une mécanique potentiellement puissante : si elle devient partie intégrante du flux de travail entre les utilisateurs et les modèles, elle capte des budgets provenant de plusieurs lignes — sécurité, conformité, modération de contenu et opérations de modèles. Mais cela signifie aussi qu'elle entre en concurrence pour les budgets avec des équipes qui disposent déjà d'outils d'observabilité et qui peuvent résister à l'ajout d'une nouvelle couche d'infrastructure.

La concentration géographique de l'équipe en Europe, avec une présence à Londres, en France et à Amsterdam, suggère que l'expansion vers le marché américain — là où se trouvent les plus grands budgets technologiques d'entreprise — nécessite une infrastructure commerciale que 20 ingénieurs ne peuvent pas assumer seuls. Le financement va probablement dans cette direction.

Une couche de contrôle que les modèles ne peuvent pas vendre seuls

L'argument le plus solide de White Circle n'est pas technique. Il est de gouvernance.

Shilov l'a formulé avec précision : il existe un problème de confiance structurel à demander à un fournisseur de modèles de juger le comportement de ses propres modèles. Anthropic ne peut pas être un arbitre neutre du comportement de Claude lorsqu'il est lui-même celui qui l'entraîne, le commercialise et facture chaque token qu'il génère. Ce n'est pas une accusation ; c'est une description d'incitations. Les laboratoires d'IA sont des entreprises ayant des intérêts commerciaux spécifiques, et leurs systèmes de sécurité sont calibrés pour ces intérêts, et non pour ceux de chaque entreprise qui déploie leurs modèles.

Cette séparation est ce qui rend le soutien d'investisseurs ayant une expérience au sein des laboratoires les plus importants du secteur stratégiquement pertinent, au-delà du simple capital. Des personnes qui connaissent les contraintes techniques et commerciales d'OpenAI, Anthropic, Mistral et DeepMind de l'intérieur parient que le problème du contrôle post-déploiement ne sera pas résolu depuis l'intérieur de ces laboratoires avec la profondeur dont les entreprises vont avoir besoin. C'est à la fois une validation du problème et un signal sur la direction que prend le marché.

La transition des chatbots vers les agents autonomes rend cet écart encore plus urgent. Un chatbot qui répond mal est un problème de réputation. Un agent qui accède à des fichiers, exécute du code, navigue sur le web et prend des actions au nom d'un utilisateur peut créer des dommages qui ne se résolvent pas avec un message d'excuse. Le marché du contrôle des agents autonomes en est à ses premiers stades, mais la direction des dépenses en IA pointe clairement dans cette direction.

White Circle est arrivée à l'annonce avec une utilisation opérationnelle, des recherches publiées, des certifications de conformité et le soutien de personnes disposant d'une crédibilité technique dans le secteur. Ce n'est pas une garantie de succès, mais c'est un point de départ considérablement plus avancé que celui où se trouvent généralement les startups en phase d'amorçage. Le prochain seuil qui compte n'est pas le prochain titre de financement ; c'est le nombre d'entreprises dans des secteurs réglementés qui décident qu'elles ont besoin d'une couche de contrôle entre leurs utilisateurs et leurs modèles avant qu'un incident ne les oblige à la chercher dans la douleur.

Partager

Vous pourriez aussi aimer