وايت سيركل تجمع 11 مليون دولار لمراقبة الذكاء الاصطناعي بعد أن رفض الجميع القيام بذلك

وايت سيركل تجمع 11 مليون دولار لمراقبة الذكاء الاصطناعي بعد أن رفض الجميع القيام بذلك

في إحدى ليالي أواخر عام 2024، كان دينيس شيلوف يشاهد مسلسلاً بوليسياً حين خطرت له فكرة تجربة غير عادية. كتب أمراً تمكّن من خلاله من جعل أي نموذج ذكاء اصطناعي يتجاهل مرشحات الأمان الخاصة به. ما استنتجه شيلوف من تلك التجربة لم يكن أنه اكتشف ثغرة برمجية، بل أن أياً من الشركات لا تمتلك طبقة تحكم بعد النشر على ما تفعله نماذج الذكاء الاصطناعي بمجرد أن يبدأ المستخدمون بالتفاعل معها.

Tomás RiveraTomás Rivera١٤ مايو ٢٠٢٦8 دقيقة
مشاركة

وايت سيركل جمعت 11 مليون دولار لمراقبة الذكاء الاصطناعي بعد أن رفض الجميع القيام بذلك

في إحدى ليالي أواخر عام 2024، كان دينيس شيلوف يشاهد مسلسلاً بوليسياً حين خطرت له فكرة تجربة بعينها. كتب أمراً برمجياً تمكّن من خلاله من جعل أي نموذج من نماذج الذكاء الاصطناعي يتجاهل مرشحات الأمان الخاصة به. كانت الحيلة بسيطة من الناحية المفاهيمية: أخبر النموذج بأن يكفّ عن التصرف كروبوت محادثة تحكمه قواعد محددة، وأن يبدأ في العمل كنقطة وصول برمجية تستجيب للطلبات مباشرةً دون أن تقيّم ما إذا كان ينبغي لها فعل ذلك أم لا. وقد نجحت هذه الحيلة مع جميع النماذج الرائدة. وفي اليوم التالي، كانت منشورته على منصة إكس قد استقطبت زخماً كافياً جعل شركة أنثروبيك تتصل به وتطلب منه الحصول على وصول خاص إلى أنظمتها.

ما خلص إليه شيلوف من تلك التجربة لم يكن أنه اكتشف ثغرة برمجية. بل كان أن أياً من الشركات لا تمتلك طبقة تحكم لاحقة للنشر تتيح لها الإشراف على ما تفعله نماذج الذكاء الاصطناعي لديها بمجرد أن يبدأ المستخدمون في التفاعل معها. وتحوّلت هذه الملاحظة إلى شركة ناشئة أطلق عليها اسم وايت سيركل، وفي الثاني عشر من مايو 2026، أعلنت هذه الشركة الباريسية عن جولة تمويل بذري بلغت 11 مليون دولار، جاء الدعم فيها من شخصيات تعرف نماذج الذكاء الاصطناعي من الداخل: مدير تجربة المطورين في أوبن إيه آي، وأحد مؤسسي أوبن إيه آي المنتقل حالياً إلى أنثروبيك، والمؤسس المشارك والعالم الرئيسي في ميسترال، والمؤسس المشارك والمدير العلمي لهاغينغ فيس، ومؤسس داتادوغ، ومبتكر كيراس، فضلاً عن مسؤولين تنفيذيين من ديب مايند وسنتري.

لا يُعدّ رأس المال الجانب الأكثر إثارةً في هذه القصة. الأكثر إثارةً هو أي نوع من البنية التحتية للأعمال يبرر هذا القناعة الراسخة في مرحلة مبكرة جداً، ولماذا تأخر ظهور استجابة السوق لهذه المشكلة تحديداً طويلاً إلى هذا الحد.

المشكلة التي تمتلك مختبرات الذكاء الاصطناعي حوافز لعدم حلها بالكامل

حين تنشر شركةٌ ما نموذجَ لغوياً في بيئة الإنتاج، فإنها ترث عقداً ضمنياً مع مزود النموذج: ذلك المزود الذي درّب النموذج ليتصرف بطريقة معينة من حيث المبدأ العام، فتفترض الشركة أن هذا التدريب يكفي لحالات الاستخدام الخاصة بها. وهذا الافتراض بات من الصعب الدفاع عنه بشكل متزايد.

النماذج الحالية هي أداة ومصدر خطر في الوقت ذاته. فقد يَعِد وكيل دعم العملاء بإعادة أموال لم تأذن بها الشركة. وقد يثبّت وكيل البرمجة شيئاً ما في آلة افتراضية لا ينبغي له الاقتراب منها. وقد يتعامل نموذج مدمج في تطبيق مالي مع بيانات حساسة للعميل بصورة خاطئة. لا شيء من هذه السيناريوهات افتراضي؛ إنها عواقب موثّقة لنشر نماذج قادرة في بيئات تعمل بتعليمات منقوصة أو غامضة.

الاستجابة المعتادة من مختبرات النماذج هي الضبط الأمني أثناء التدريب. لكن هذا الضبط هو بطبيعته ذو طابع عام. إنه مُعدَّل لمنع النموذج من شرح كيفية صنع الأسلحة أو إنتاج محتوى ضار بصورة مجردة. غير أنه ليس مُعدَّلاً وفق السياسة الخاصة لشركة خدمات مالية بعينها فيما يخص ما يمكنها وما لا يمكنها الوعد به في محادثة مع عميل، ولا وفق القيود التي تفرضها شركة رعاية صحية على البيانات التي يجوز تقاطعها مع بعضها.

ويُشير شيلوف إلى شيء أعمق بنيوياً: تتقاضى المختبرات ثمن الرموز المدخلة والمخرجة حتى حين يرفض النموذج طلباً ضاراً. وهذا يعني أنها تمتلك دوافع اقتصادية محدودة لحجب الإساءة قبل أن تبلغ النموذج. كما يُشير إلى ما يُعرف بـ"ضريبة المواءمة": فتدريب نماذج أكثر أماناً يميل إلى تراجع أدائها في مهام كالبرمجة. وهذا التوتر بين الأمان والأداء لا يختفي بمزيد من التمويل؛ إنه قيد تقني تديره المختبرات ولا تُزيله.

تراهن وايت سيركل على أن هذه الفجوة لن تُسدّ من جانب التدريب وحده. منتجها عبارة عن طبقة تطبيق في الوقت الفعلي تجلس بين مستخدمي الشركة ونماذجها، تفحص المدخلات والمخرجات في ضوء السياسات الخاصة بتلك الشركة، ويمكنها حجب السلوكيات الإشكالية أو الإشارة إليها: كالهلوسات، وتسريب البيانات، والمحتوى المحظور، وحقن الأوامر، والإجراءات التدميرية في بيئات البرمجيات. وتقول الشركة إنها عالجت أكثر من مليار طلب برمجي عبر واجهة التطبيقات، وإن لديها عملاء نشطين في قطاعات التكنولوجيا المالية والقانون وأدوات التطوير، من بينهم لوفيبل. ويدعم النظام أكثر من 150 لغة، ويحمل شهادتَي SOC 2 النوع الأول والثاني، إلى جانب الامتثال لمعيار HIPAA.

ما الذي يُثبته مليار طلب وما لا يُثبته

مليار طلب عبر واجهة التطبيقات رقم يبدو ضخماً، لكنه قد يعني أشياء مختلفة جداً بحسب حجم الطلبات لكل عميل، ونوع الطلب، ومعدل الاحتفاظ بالعملاء. تأسست وايت سيركل عام 2025 وتضم 20 موظفاً، أغلبهم من المهندسين. وهذا يوحي ببنية معمارية مصممة للتوسع اعتماداً على البنية التحتية لا على فريق الخدمة، وهو ما يتسق مع نموذج واجهة التطبيقات القائم على اعتراض حركة البيانات الموجودة أصلاً.

ما يُثبته هذا الرقم فعلاً، بقدر ما تسمح البيانات المتاحة للعموم باستخلاصه، هو أن المنصة تحظى بزخم تشغيلي حقيقي، لا مجرد زخم علاقات عامة. وثمة فارق جوهري بين شركة تُعلن عن تمويلها مصحوباً بقائمة من العملاء المحتملين، وشركة تصل إلى هذا الإعلان وهي تمتلك أدلة على استخدام مستدام. وكذلك يعمل المعيار المرجعي الذي نشرته وايت سيركل في مايو 2026، المعروف بـKillBench، كإشارة إلى النضج التقني: إذ أجرت أكثر من مليون تجربة على 15 نموذجاً من أوبن إيه آي وغوغل وأنثروبيك وإكس إيه آي لقياس التحيزات في سيناريوهات اتخاذ القرار عالية المخاطر. وأظهرت النتائج أن النماذج كانت تتخذ قرارات مختلفة بناءً على سمات كالجنسية والديانة ونوع الهاتف، وأن هذه التحيزات كانت تزداد سوءاً حين تُطلب الردود بتنسيقات منظمة لتقرأها البرمجيات، وهو بالضبط الأسلوب الذي تعتمده أغلب الشركات في ربط نماذجها بأنظمتها الإنتاجية.

وهذه النتيجة لها تداعيات مباشرة على أي شركة تستخدم الذكاء الاصطناعي في اتخاذ قرارات ذات عواقب فعلية. إنها ليست تجربة أكاديمية؛ بل هي توثيق لمتجه خطر يقع في أكثر أساليب التكامل شيوعاً.

ما لا يُثبته هذا الرقم بعد، هو الاستعداد للدفع على نطاق واسع. يمتلك نموذج العمل القائم على طبقة التحكم التي تعترض حركة البيانات آليةً قد تكون قوية: فإذا أصبح جزءاً لا يتجزأ من مسار العمل بين المستخدمين والنماذج، فإنه يستحوذ على ميزانيات خطوط متعددة: الأمان، والامتثال، وتشكيل المحتوى، وعمليات النماذج. غير أن هذا يعني أيضاً أنه يتنافس على الميزانية مع فرق تمتلك بالفعل أدوات رصد وملاحظة، وقد تُقاوم إضافة طبقة بنية تحتية أخرى.

يُشير تركز الفريق جغرافياً في أوروبا، مع حضور في لندن وفرنسا وأمستردام، إلى أن التوسع نحو السوق الأمريكية التي تضم أضخم ميزانيات التكنولوجيا للمؤسسات، يستلزم بنية تحتية للمبيعات لا يستطيع 20 مهندساً توفيرها. ومن المرجح أن التمويل سيتجه إلى هذا الغرض.

طبقة تحكم لا تستطيع النماذج بيعها بمفردها

الحجة الأقوى التي تسوقها وايت سيركل ليست تقنية. إنها حجة حوكمة.

صاغها شيلوف بدقة: ثمة مشكلة ثقة بنيوية في أن تطلب من مزود نماذج أن يحكم على سلوك نماذجه هو ذاته. لا تستطيع أنثروبيك أن تكون حَكَماً محايداً لسلوك كلود وهي من يدرّبه ويُسوّق له ويتقاضى ثمن كل رمز يُولّده. هذا ليس اتهاماً؛ بل هو وصف للحوافز. مختبرات الذكاء الاصطناعي شركات ذات مصالح تجارية محددة، وأنظمتها الأمنية مُعيَّرة وفق تلك المصالح، لا وفق مصالح كل شركة تنشر نماذجها.

هذا الفصل هو ما يجعل دعم المستثمرين ذوي الخبرة داخل أبرز المختبرات في القطاع ذا أهمية استراتيجية تتجاوز رأس المال. فأشخاص يعرفون القيود التقنية والتجارية لأوبن إيه آي وأنثروبيك وميسترال وديب مايند من الداخل، يراهنون على أن مشكلة التحكم بعد النشر لن تُحلّ من داخل تلك المختبرات بالعمق الذي ستحتاجه الشركات. وهذا في آنٍ واحد تحقق من صحة المشكلة وإشارة إلى اتجاه السوق.

ويجعل الانتقال من روبوتات المحادثة إلى الوكلاء المستقلين هذه الفجوة أكثر إلحاحاً. روبوت المحادثة الذي يُجيب إجابات خاطئة مشكلة سمعة. أما الوكيل الذي يصل إلى الملفات ويُنفّذ التعليمات البرمجية ويتصفح الويب ويتخذ إجراءات نيابةً عن مستخدم ما، فيمكنه إحداث أضرار لا تتدارك بمجرد رسالة اعتذار. يوجد سوق التحكم في الوكلاء المستقلين في مراحله الأولى، لكن اتجاه الإنفاق في مجال الذكاء الاصطناعي يُشير إليه بوضوح.

وصلت وايت سيركل إلى هذا الإعلان وهي تمتلك استخداماً تشغيلياً فعلياً، وأبحاثاً منشورة، وشهادات امتثال، ودعماً من أشخاص يتمتعون بمصداقية تقنية في القطاع. لا يُعدّ ذلك ضماناً للنجاح، لكنه نقطة انطلاق تقع أمام المستوى الذي تكون عليه الشركات الناشئة عادةً في مرحلة التمويل البذري بفارق ملحوظ. العتبة التالية التي تكتسب أهميتها ليست العنوان التمويلي القادم؛ بل هي عدد الشركات في القطاعات الخاضعة للتنظيم التي تُقرر أنها تحتاج إلى طبقة تحكم بين مستخدميها ونماذجها قبل أن يضطرها حادث ما إلى البحث عنها على الطريقة الصعبة.

مشاركة

قد يعجبك أيضاً