الذكاء الاصطناعي والإشراف البشري في المؤسسات

الحلقة البشرية لا تُعيق الذكاء الاصطناعي في المؤسسات، بل هي التي تجعله ممكناً

ثمة طريقة شائعة جداً للوقوع في الخطأ عند التعامل مع الذكاء الاصطناعي في المؤسسات. تتمثل هذه الطريقة في قياس نضج أي نظام بعدد الوظائف التي نجح في إلغائها. هذا المقياس لا يقيس النضج في الحقيقة؛ إنه يقيس السرعة من دون حوكمة، وهي بالضبط الحالة التي تسبق أكثر الانهيارات كلفةً في الأنظمة الحيوية.

ظل النقاش حول مفهوم human-in-the-loop —وهو النموذج الذي يُدمج فيه الحكم البشري بصورة صريحة ومتعمدة في مسارات عمل الذكاء الاصطناعي— يكتسب زخماً متصاعداً في مجالس إدارة الشركات الكبرى منذ أشهر. ليس لأن المديرين التنفيذيين باتوا أكثر تحفظاً انسياقاً مع موضة تنظيمية، بل لأن أولى عمليات النشر على نطاق واسع بدأت تكشف عن حقيقة مزعجة: إذ تولّد النماذج ردوداً سلسة تبدو صحيحة في ظاهرها، بينما تنتهك السياسات الداخلية، أو تسيء تفسير السياق التنظيمي، أو تقدم توصيات لم يكن أحد في المؤسسة ليوقّع عليها.

وفقاً لبيانات شركة غارتنر، لا يصل ما يقارب نصف مبادرات الذكاء الاصطناعي التوليدي إلى مرحلة التوسع الفعلي. والعامل الرئيسي في ذلك ليس جودة النموذج، بل غياب ضوابط المخاطر أو قصورها. فالسرعة من دون بنية لا تُسرّع التبني: بل تُجهضه.

الفرق بين الحساب والفهم له تداعيات مالية ملموسة

يستطيع نظام الذكاء الاصطناعي معالجة عقود من بيانات الحوادث التشغيلية، وتحديد أنماط الفشل قبل وقوعها، وفي حالات مضبوطة، تفعيل استجابات تصحيحية آلية. هذا ذو قيمة حقيقية لا شك فيها. غير أنه يستطيع أيضاً توليد توصية تقنية لا غبار عليها، مع تجاهل تام للسياق التعاقدي أو التنظيمي أو السياسي الذي يجب أن تُنفَّذ فيه تلك التوصية.

هذا التمييز ليس فلسفياً. له ثمن. ففي منصات الدفع، وأنظمة التأمين، وتدفقات الرعاية الصحية، وأي بيئة يُفضي فيها مخرج خاطئ إلى تبعات قانونية أو مالية أو تتعلق بالسمعة، فإن الفرق بين "الإجابة الصحيحة" و"الإجابة الملائمة للسياق" يساوي ملايين. تتنبأ نماذج اللغة بتسلسلات كلمات ذات احتمالية عالية؛ ولا تتحمل ولا يمكنها أن تتحمل المسؤولية عن تبعات تلك التسلسلات في بيئة واقعية.

ما تفعله human-in-the-loop في هذا السيناريو أمر ملموس للغاية: إنها توزع الحكم عبر دورة حياة النظام بأكملها، لا في نهايتها فحسب بوصفها خطوة مراجعة. وثمة أربع طبقات تتجلى فيها هذه التوزيعية. أولاً: في تحديد الأهداف وقيود الأداء قبل أن يبدأ النموذج في العمل. ثانياً: في مراجعة الخطط قبل التنفيذ، لا سيما حين يقترح النظام خطوات ذات عواقب غير قابلة للعكس. ثالثاً: في الإشراف أثناء التنفيذ، مع قدرة فعلية على المقاطعة أو التراجع. رابعاً: في التغذية الراجعة التصحيحية التي تضبط السلوك المستقبلي للنظام. إن إقصاء البشر من أي من هذه الطبقات لا يبسّط النظام: بل يجعله معتماً وهشاً في آنٍ معاً.

تُقدّر الأبحاث التي وثّقتها شركة فورستر ومزودو خدمات في القطاع أن إدراج المراجعة البشرية في مسارات قرارات الذكاء الاصطناعي يحسّن دقة تلك القرارات بنسبة تتراوح بين 15% و20%. هذا ليس وعداً تسويقياً: إنه تكلفة إقصاء الإنسان من المواضع التي لا يمتلك فيها النموذج معلومات سياقية كافية للتصرف بشكل صحيح. في الوقت ذاته، يظل الخطر المعاكس قائماً وبالغ الكلفة: فإذا كانت المراجعة البشرية إلزامية لكل قرار روتيني، يتحول النظام إلى دعم مكلف لاتخاذ القرارات مع ضعف شديد في الأتمتة الفعلية. إن نقطة المعايرة —أين تنطبق الحلقة البشرية وأين لا تنطبق— هي التي تُحدد اقتصاديات النموذج.

من كان في الغرفة حين صُمِّم النظام؟

هذه هي النقطة التي يقف عندها النقاش المعتاد حول human-in-the-loop قاصراً. إذ تضع معظم الأطر التشغيلية الإنسان في لحظة التنفيذ: يراجع المخرجات، ويوافق عليها أو يرفضها، ويُصعّد الأمر عند الشك. هذا يحل جزءاً من المشكلة. لكنه لا يلمس اللحظة التي تتأصل فيها اللامساواة فعلاً: لحظة التصميم.

حين يحدد فريق ما البيانات التي يتدرب عليها النموذج، والمتغيرات التي يعدّها ذات صلة، والعتبات التي تُحدد متى يُصعَّد الأمر إلى مراجع بشري، والملفات الشخصية المستخدمة للتحقق من المخرجات، فإن تلك القرارات تُرسّخ رؤية بعينها للعالم. وإذا كان ذلك الفريق متجانساً —نفس التكوين الأكاديمي، ونفس قطاع الخبرة، ونفس الموضع في هيكل السلطة التنظيمية— فإن قيود ذلك الفريق وتحيزاته تُطمر في البنية قبل نشر النظام. ومراجعة human-in-the-loop أثناء التشغيل لا تُصحح ذلك. بل تطبّقه بمزيد من الاتساق.

إن الحوكمة الحقيقية لنظام الذكاء الاصطناعي لا تبدأ حين يصبح النموذج في مرحلة الإنتاج. بل تبدأ حين يُقرَّر أي مشكلة ستُحَل، وبأي بيانات، وفي ظل أي قيود، ومن يكون في الغرفة. الفرق أن الفرق ذات التجانس العالي في التكوين والمنظور تمتلك نقاطاً عمياء لا يدركها أعضاء الفريق بوصفها نقاطاً عمياء، لأن لا أحد داخل الفريق لديه الموضع أو الزاوية اللازمين لرؤيتها. يُسمّون تماسكاً ما هو في أحيان كثيرة هشاشة: عجز عن اكتشاف ما يستبعده الإطار المفاهيمي ذاته بحكم افتراضاته الضمنية.

وهذا له تبعات قابلة للقياس. ففي أنظمة التوظيف الآلي، تتضخم التحيزات التاريخية في الاستقطاب إذا لم يكن ثمة أحد في مرحلة التصميم يُحددها. وفي أنظمة تقييم الائتمان، تُولّد النماذج المدرّبة على بيانات مجتمعات ظلت تاريخياً محرومة من الخدمات المصرفية تقييمات بنيوياً غير مواتية لتلك المجتمعات ذاتها. وفي أنظمة الفرز الطبي، تُنتج بيانات التدريب التي تعكس تفاوتات سابقة في الرعاية توصيات تعيد إنتاج تلك التفاوتات بسرعة أكبر وعلى نطاق أوسع. لا يُحَل أي من هذه المشكلات بإضافة مراجع بشري في نهاية التدفق إذا كان التصميم قد دمجها بالفعل كمسلّمات.

المقياس الذي تستخدمه المؤسسات بصورة خاطئة

إن الخطأ الأكثر شيوعاً في الحوكمة ضمن عمليات نشر الذكاء الاصطناعي المؤسسي ليس خطأً تقنياً. بل هو خطأ مفاهيمي: قياس نجاح النظام بمعدل الاحتواء —أي عدد التفاعلات التي يعالجها النموذج دون تدخل بشري— بدلاً من قياس ما إذا كانت التدخلات البشرية التي تحدث فعلاً هي التدخلات الصحيحة، وتحدث في الوقت الصحيح، ويُنجزها الأشخاص الذين يمتلكون السياق الكافي لأدائها بإتقان.

إن تحسين الأداء بهدف تقليص التدخل البشري بوصفه غاية في حد ذاتها يُنتج أنظمة تُقلّص الحلقة البشرية بدلاً من معايرتها. فنظام خدمة العملاء الذي يحافظ على معدل احتواء يبلغ 90% ربما يعالج 90% من الحالات بجودة مقبولة، لكنه يحجب بشكل منهجي الـ10% الأكثر تعقيداً —وهي بالضبط الحالات ذات أعلى قيمة للعميل— بردود لن يوافق عليها أحد في المؤسسة لو اطّلع عليها. يبدو الرقم جيداً على لوحة القيادة. لكن الضرر لا يظهر حتى يغادر العميل.

المقاييس ذات الأهمية الحقيقية مختلفة: معدل التصعيد الملائم، ووقت الحل بعد التصعيد، والفرق في الرضا بين الحالات التي يعالجها النموذج والحالات التي تُعالَج بتدخل بشري، ومعدل التغذية الراجعة التصحيحية التي تُعدّل فعلاً السلوك المستقبلي للنظام. هذه المقاييس ليست أصعب في الحصول عليها. بل هي أصعب في الدفاع عنها أمام مدير تنفيذي يريد أن يرى كم وفّرته الأتمتة من أموال. لكنها المقاييس الوحيدة التي تكشف ما إذا كان النظام يتعلم أم يتراكم فيه الأخطاء بكفاءة أعلى من ذي قبل.

يستلزم جزء من عملية المعايرة هذه أيضاً إضفاء الطابع الرسمي على أدوار لا تمتلكها معظم المؤسسات بعد. فأمين بيانات الذكاء الاصطناعي —الشخص المسؤول عن مراجعة التسميات، ومراقبة انجراف النموذج، وإدارة حلقات التغذية الراجعة— ليس لقباً زخرفياً. إنه الوظيفة التي تبقي النظام يتعلم في الاتجاه الصحيح بدلاً من أن ينجرف نحو سلوكيات لم يُصمّمها أحد صراحةً، لكن لم يوقفها أحد في الوقت المناسب.

التكلفة الحقيقية لإقصاء البشر من النظام قبل الأوان

تصف شركة IBM دور الإنسان في أنظمة الذكاء الاصطناعي الوكيلي بتشبيه دقيق: إنه ليس من يُراقب النظام كالمربي، بل من يمارس مهام مراقبة الحركة الجوية. فهو لا يُنفّذ كل رحلة، بل يُحدد الممرات، ويضع الأولويات، ويتدخل حين تبرز ظروف استثنائية، ولديه السلطة والتدريب اللازمان لاتخاذ قرارات لا يستطيع النظام الآلي اتخاذها وحده. هذا التمييز مهم لأنه يُغيّر الحجة بشأن تكاليف العمالة تغييراً جذرياً.

الحجة الخاطئة هي: "كلما نضج النظام، احتجنا إلى عدد أقل من البشر". والحجة الصحيحة هي: "كلما نضج النظام، سيعمل البشر في طبقات أعلى من صنع القرار بتأثير أكبر لكل تدخل". إذ تنتقل الأدوار الروتينية في الإشراف نحو أدوار تحديد السياسات، والتحقق من البنية، وتقييم العواقب غير المتوقعة. هذا ليس تقليصاً في الكوادر البشرية: بل هو إعادة توزيع للذكاء نحو المواضع التي لا يستطيع النظام الوصول إليها وحده.

ما تصفه شركة نوفينتو بوصفه توتراً بين human-in-the-loop والنماذج الوكيلية حقيقي، لكنه ليس معضلة دائمة. إنه منحنى نضج. في المراحل الأولى من التبني، يجب أن تكون الحلقة البشرية ضيقة لأن المؤسسة لم تُرسّخ بعد الضمانات اللازمة ولا السجل التشغيلي الكافي للثقة في استقلالية النظام. ومع تراكم المؤسسة لأدلة كافية حول سلوك النموذج في الحالات الحدية، ومواطن فشله والظروف التي يفشل فيها، يمكنها توسيع استقلالية النظام بصورة مدروسة ومعايَرة، لا توسيعها بصورة عمياء.

المشكلة التي تواجهها المؤسسات التي تتسارع نحو الاستقلالية قبل امتلاك هذه الأدلة هي أن الأخطاء تحدث على نطاق واسع قبل أن يكون ثمة آلية لرصدها بشكل منهجي. وتتجاوز سرعة النشر سرعة التعلم المؤسسي. وحين يحدث ذلك، تكون تكلفة التصحيح بنيوياً أعلى من التكلفة التي كانت ستترتب على الإبقاء على الحلقة البشرية نشطة لفترة أطول.

إن بنية السلطة التي يكشف عنها هذا النموذج بسيطة وإن كانت تُزعج المؤسسات التي تقيس نجاحها بسرعة الأتمتة: فالذكاء الموزع —أي البشر الذين يمتلكون سياقات مختلفة ومتموضعون في نقاط مختلفة من النظام— ليس تنازلاً أمام المخاطر. إنه الشرط الذي يتيح للنظام العمل بسرعة حقيقية بدلاً من سرعة وهمية. فإقصاء تلك العقد الذكية لتحقيق كفاءة آنية يُنتج أنظمة أسرع وأكثر عمىً في آنٍ معاً، وهي بالضبط الجمع الذي يجعل الانهيارات —حين تأتي— أكثر كلفةً وأصعب تفسيراً أمام الجهات التنظيمية والعملاء ومجالس الإدارة.