White Circle ने 11 मिलियन डॉलर जुटाए AI की निगरानी के लिए — जब कोई और यह करने को तैयार नहीं था
2024 के अंत की एक रात, Denis Shilov एक क्राइम थ्रिलर देख रहे थे, तभी उनके मन में एक प्रयोग का विचार आया। उन्होंने एक ऐसा prompt लिखा जो किसी भी आर्टिफिशियल इंटेलिजेंस मॉडल को उसके अपने सुरक्षा फिल्टर को नज़रअंदाज़ करने पर मजबूर कर देता था। तरकीब वैचारिक रूप से सरल थी: मॉडल को यह बताना था कि वह नियमों वाले chatbot की तरह व्यवहार करना बंद करे और एक ऐसे software access point की तरह काम करे जो बस अनुरोधों का जवाब देता है — यह सोचे बिना कि उसे ऐसा करना चाहिए या नहीं। यह सभी प्रमुख मॉडलों पर काम कर गया। अगले दिन, X पर उनकी पोस्ट ने इतनी traction हासिल कर ली कि Anthropic ने उनसे संपर्क किया और अपने सिस्टम तक निजी पहुँच माँगी।
Shilov ने उस प्रकरण से जो निष्कर्ष निकाला, वह यह नहीं था कि उन्हें कोई bug मिला है। उनका निष्कर्ष यह था कि किसी भी कंपनी के पास post-deployment नियंत्रण की कोई परत नहीं थी — यानी एक बार जब users अपने AI मॉडलों के साथ बातचीत शुरू करते हैं, तो वे मॉडल क्या करते हैं, इस पर कोई नियंत्रण नहीं था। यही अवलोकन White Circle बन गया, और 12 मई 2026 को इस पेरिसियाई startup ने 11 मिलियन डॉलर की एक seed round की घोषणा की, जिसे ऐसे लोगों का समर्थन मिला जो मॉडलों को अंदर से जानते हैं: OpenAI के developer experience निदेशक, OpenAI के एक सह-संस्थापक जो अब Anthropic में हैं, Mistral के सह-संस्थापक और मुख्य वैज्ञानिक, Hugging Face के सह-संस्थापक और मुख्य वैज्ञानिक निदेशक, Datadog के संस्थापक, Keras के निर्माता, और DeepMind तथा Sentry के कार्यकारी।
इस कहानी में सबसे दिलचस्प बात पूंजी नहीं है। दिलचस्प यह है कि किस तरह का व्यावसायिक बुनियादी ढाँचा इतनी जल्दी इस विश्वास को उचित ठहराता है — और इस विशेष समस्या पर बाज़ार की प्रतिक्रिया आने में इतनी देर क्यों लगी।
वह समस्या जिसे हल करने के लिए AI प्रयोगशालाओं के पास पूरे प्रोत्साहन नहीं हैं
जब कोई कंपनी production में एक language model तैनात करती है, तो वह मॉडल प्रदाता के साथ एक अनकहा अनुबंध अपने ऊपर ले लेती है: प्रदाता ने मॉडल को सामान्य रूप से एक निश्चित तरीके से व्यवहार करने के लिए प्रशिक्षित किया है, और कंपनी यह मान लेती है कि वह प्रशिक्षण उसके विशिष्ट उपयोग के मामलों के लिए पर्याप्त है। यह धारणा बनाए रखना दिन-ब-दिन कठिन होता जा रहा है।
आज के मॉडल एक साथ उपकरण भी हैं और जोखिम भी। एक customer support agent ऐसा रिफंड देने का वादा कर सकता है जिसे कंपनी ने अधिकृत नहीं किया। एक coding agent किसी virtual machine पर कुछ install कर सकता है जिसे छुआ नहीं जाना चाहिए था। एक financial application में integrated मॉडल client के संवेदनशील डेटा को गलत तरीके से संभाल सकता है। इनमें से कोई भी परिदृश्य काल्पनिक नहीं है; ये सभी अधूरे या अस्पष्ट निर्देशों वाले वातावरण में सक्षम मॉडल तैनात करने के दस्तावेज़ी परिणाम हैं।
मॉडल प्रयोगशालाओं का सामान्य जवाब प्रशिक्षण के दौरान सुरक्षा समायोजन है। लेकिन वह समायोजन, परिभाषा से ही, सामान्य होता है। यह इस तरह से calibrate किया जाता है कि मॉडल हथियार बनाने की विधि न बताए या अमूर्त रूप से हानिकारक सामग्री न बनाए। यह किसी financial services कंपनी की उस विशिष्ट नीति के लिए calibrate नहीं है जो यह तय करती है कि client के साथ बातचीत में क्या वादा किया जा सकता है और क्या नहीं, और न ही किसी स्वास्थ्य कंपनी की उन प्रतिबंधों के लिए जो बताती है कि कौन-सा डेटा आपस में साझा किया जा सकता है।
Shilov एक और अधिक संरचनात्मक बात की ओर इशारा करते हैं: प्रयोगशालाएँ input और output tokens के लिए चार्ज करती हैं, यहाँ तक कि जब मॉडल किसी हानिकारक अनुरोध को अस्वीकार करता है। इसका मतलब है कि मॉडल तक पहुँचने से पहले दुरुपयोग को रोकने के लिए उनके पास सीमित आर्थिक प्रेरणा है। वे "alignment tax" की भी बात करते हैं: अधिक सुरक्षित मॉडलों को प्रशिक्षित करने से coding जैसे कार्यों में उनका प्रदर्शन कम हो जाता है। सुरक्षा और प्रदर्शन के बीच यह तनाव अधिक funding से नहीं जाता; यह एक तकनीकी बाधा है जिसे प्रयोगशालाएँ प्रबंधित करती हैं, समाप्त नहीं करतीं।
White Circle का दांव यह है कि यह खाई केवल प्रशिक्षण पक्ष से नहीं भरी जाएगी। इसका उत्पाद एक real-time application परत है जो कंपनी के users और उनके मॉडलों के बीच बैठती है, inputs और outputs को उस कंपनी की विशिष्ट नीतियों के विरुद्ध जाँचती है, और समस्याग्रस्त व्यवहारों को block या flag कर सकती है: hallucinations, डेटा लीक, प्रतिबंधित सामग्री, prompt injection, software वातावरण में विनाशकारी कार्रवाइयाँ। कंपनी का कहना है कि उसने एक अरब से अधिक API requests process की हैं और fintech, legal तथा development tools में — जिसमें Lovable भी शामिल है — सक्रिय clients हैं। यह सिस्टम 150 से अधिक भाषाओं को support करता है और इसके पास SOC 2 Type I और II certifications के साथ-साथ HIPAA compliance भी है।
एक अरब requests क्या validate करती हैं और क्या नहीं
एक अरब API requests वह संख्या है जो बड़ी लगती है लेकिन प्रति client volume, request के प्रकार और retention दर के आधार पर बहुत अलग-अलग चीज़ें मायने रख सकती हैं। White Circle की स्थापना 2025 में हुई थी और इसके 20 employees हैं, जिनमें से लगभग सभी engineers हैं। इससे पता चलता है कि यह architecture service team के बजाय infrastructure के साथ scale करने के लिए डिज़ाइन की गई है, जो एक API model के अनुरूप है जो मौजूदा traffic को intercept करता है।
यह संख्या जो validate करती है — जहाँ तक सार्वजनिक डेटा से निष्कर्ष निकाला जा सकता है — वह यह है कि platform में operational traction है, न कि केवल PR traction। एक ऐसी कंपनी के बीच महत्वपूर्ण अंतर है जो संभावित clients की सूची के साथ funding की घोषणा करती है और एक ऐसी कंपनी जो sustained use के साक्ष्य के साथ घोषणा करती है। White Circle ने मई 2026 में KillBench नाम का जो benchmark प्रकाशित किया, वह भी तकनीकी परिपक्वता के संकेत के रूप में काम करता है: उन्होंने उच्च-जोखिम वाले निर्णय परिदृश्यों में पूर्वाग्रहों को मापने के लिए OpenAI, Google, Anthropic और xAI के 15 मॉडलों पर दस लाख से अधिक प्रयोग किए। परिणामों से पता चला कि मॉडल राष्ट्रीयता, धर्म या फोन के प्रकार जैसे attributes के आधार पर अलग-अलग निर्णय लेते थे, और ये पूर्वाग्रह तब और बढ़ जाते थे जब responses को software द्वारा पढ़े जाने वाले structured formats में माँगा जाता था — जो कि ठीक वही तरीका है जिससे अधिकांश कंपनियाँ मॉडलों को अपने production systems से जोड़ती हैं।
इस निष्कर्ष के उन सभी कंपनियों के लिए प्रत्यक्ष परिणाम हैं जो वास्तविक परिणामों वाले निर्णयों में AI का उपयोग करती हैं। यह कोई academic प्रयोग नहीं है; यह सबसे सामान्य integration format में होने वाले एक risk vector का दस्तावेज़ीकरण है।
जो संख्या अभी तक validate नहीं करती, वह है scale पर भुगतान करने की तत्परता। एक ऐसी control layer के व्यवसाय मॉडल में जो traffic को intercept करती है, एक संभावित रूप से शक्तिशाली mechanics है: यदि यह users और मॉडलों के बीच workflow का हिस्सा बन जाती है, तो यह कई बजट लाइनों — security, compliance, content moderation और model operations — से बजट capture करती है। लेकिन इसका मतलब यह भी है कि यह उन teams के बजट के लिए compete करती है जिनके पास पहले से observability tools हैं और जो एक और infrastructure layer जोड़ने से बच सकती हैं।
यूरोप में — London, France और Amsterdam में — team की geographic concentration से पता चलता है कि अमेरिकी बाज़ार में विस्तार के लिए — जहाँ सबसे बड़े enterprise technology बजट हैं — sales infrastructure की ज़रूरत है जिसे 20 engineers cover नहीं कर सकते। Funding संभवतः वहीं जाएगी।
एक control layer जिसे मॉडल अकेले नहीं बेच सकते
White Circle का सबसे मज़बूत तर्क तकनीकी नहीं है। यह governance का तर्क है।
Shilov ने इसे सटीक रूप से कहा: एक model provider से अपने ही मॉडलों के व्यवहार का न्याय करने के लिए कहने में एक structural trust problem है। Anthropic Claude के व्यवहार का निष्पक्ष मध्यस्थ नहीं हो सकता जब वही उसे train करता है, उसे commercial बनाता है और हर generated token के लिए charge करता है। यह कोई आरोप नहीं है; यह incentives का वर्णन है। AI प्रयोगशालाएँ विशिष्ट व्यावसायिक हितों वाली कंपनियाँ हैं, और उनके safety systems उन हितों के लिए calibrate किए गए हैं — उन हर कंपनी के हितों के लिए नहीं जो उनके मॉडल तैनात करती है।
यही अलगाव है जो sector की सबसे महत्वपूर्ण प्रयोगशालाओं में अनुभव रखने वाले निवेशकों का समर्थन पूंजी से परे strategic रूप से प्रासंगिक बनाता है। जो लोग OpenAI, Anthropic, Mistral और DeepMind की तकनीकी और व्यावसायिक बाधाओं को अंदर से जानते हैं, वे इस बात पर दाँव लगा रहे हैं कि post-deployment control की समस्या उन प्रयोगशालाओं के अंदर से उस गहराई के साथ हल नहीं होगी जिसकी कंपनियों को ज़रूरत होगी। यह समस्या की एक validation है और साथ ही बाज़ार की दिशा के बारे में एक संकेत भी।
Chatbots से autonomous agents में transition इस खाई को और अधिक urgent बना देता है। एक chatbot जो गलत जवाब देता है, वह एक reputation problem है। एक agent जो files तक पहुँचता है, code execute करता है, web browse करता है और user की ओर से actions लेता है — वह ऐसे नुकसान पैदा कर सकता है जिन्हें माफी के संदेश से नहीं पलटा जा सकता। Autonomous agents के control का बाज़ार अपने शुरुआती दौर में है, लेकिन AI spending की दिशा वहाँ स्पष्ट रूप से इशारा कर रही है।
White Circle घोषणा तक operational use, published research, compliance certifications और sector में तकनीकी credibility रखने वाले लोगों के समर्थन के साथ पहुँचा। यह सफलता की गारंटी नहीं है, लेकिन यह एक ऐसी शुरुआती रेखा है जो seed stage पर startups की सामान्य स्थिति से काफी आगे है। अगला महत्वपूर्ण threshold अगली funding headline नहीं है; यह यह है कि regulated sectors में कितनी कंपनियाँ यह तय करती हैं कि उन्हें अपने users और मॉडलों के बीच एक control layer की ज़रूरत है — इससे पहले कि कोई घटना उन्हें मुश्किल रास्ते से इसे ढूँढने पर मजबूर करे।











