التقييم المستمر لا يعني الفهم الأعمق

التقييم المستمر لا يعني بالضرورة فهماً أعمق

لعقود متتالية، اعتمدت صناعة الطيران في قياس كفاءة الطيار على مقياسَين اثنين: ساعات التحليق المتراكمة في قمرة القيادة، ونوع الطائرة الحاصل عليها بشهادة رسمية. كانت هذه المؤشرات مكلفة الاستخراج، يصعب تزويرها، وتنبؤية بدرجة معقولة. لم يكن النظام مثالياً، لكنه امتلك فضيلة نادراً ما تعترف بها المنظمات بالقدر الكافي: كان يعرف تحديداً ماذا يقيس ولماذا يقيس.

أما اليوم، فثمة عدد متزايد من الشركات يهاجر نحو أنظمة تقييم مستمر للأداء، كثيرٌ منها مدفوع بالذكاء الاصطناعي، انطلاقاً من مقدمة مفادها أن معرفة موظفيها بصورة أعمق وأكثر تكراراً ستُمكّنها من اتخاذ قرارات أفضل في مجالات المواهب والتدريب والهيكل التنظيمي. الوعد مغرٍ بلا شك. لكن المشكلة تكمن في أن تكرار القياس لا يعادل عمق الفهم، وهذا الخلط يحمل تبعات استراتيجية لا تُقدّر كثير من الشركات حجمها الحقيقي.

مقال حديث نشرته مجلة هارفارد بيزنس ريفيو، ووقّعه سانجيت بول شودري وجون وينسور، وهما شخصيتان أسهمتا بعمل متواصل في تقاطع الذكاء الاصطناعي وتصميم المنظمات، يضعان هذا التوتر على الطاولة بصورة مباشرة. حجتهما الجوهرية دقيقة: إن تقدم الذكاء الاصطناعي يُعيد تصميم تقسيم العمل بين البشر والآلات بسرعة لا تستطيع الأدوات التقليدية، كالمسميات الوظيفية والسير الذاتية والتقييمات السنوية، مجاراتها. ما يقترحانه بديلاً عن ذلك هو أنظمة تقييم مستمر تلتقط القدرات بصورة ديناميكية وتربطها بقرارات التدريب والتنقل الداخلي وتخطيط القوى العاملة. تشخيصهما في محله تماماً. أما النقاش الحقيقي فيبدأ حين نفحص البنية الفعلية لتلك الحلول.

ما يحله التقييم المستمر وما يعجز عن حله

الحجة لصالح أنظمة التقييم المستمر ليست هشة. البيانات المتعلقة بمراجعات الأداء السنوية التقليدية هي، بالوصف الدقيق، مدمّرة على صعيد الكفاءة. شركة مؤلفة من مئة موظف تخصص ما يقارب 5.500 ساعة سنوياً لعمليات مراجعة الأداء الرسمية، دون احتساب الوقت الذي يستثمره الموظفون أنفسهم في التقييمات الذاتية. وهذا يعادل ما يقارب ثلاثة مناصب بدوام كامل تستنزفها طقوس تقييمية يرى 35% من الموظفين أنها غير عادلة، وتولّد من القلق ما يكفي لجعل واحد من كل خمسة موظفين يتغيبون بإجازة مرضية في يوم التقييم.

إن كان النموذج المراد استبداله يُفرز هذا المستوى من الاحتكاك وانعدام الثقة، فالحاجة إلى التغيير لا تحتاج إلى مزيد من الحجج. وهنا تحديداً تقدم أنظمة التقييم المستمر شيئاً ذا قيمة حقيقية: إمكانية تحويل بيانات العمل الفعلي إلى إشارات مبكرة حول فجوات المهارات، والكشف عن المواهب التي لم تكن الدوائر الرسمية لتُبرزها قط، وضبط تخطيط القوى العاملة قبل أن تغدو أزمة القدرات أمراً لا يمكن التراجع عنه.

للكفاءة أيضاً حجتها من زاوية الوقت الإداري. فإن استطاع الذكاء الاصطناعي أتمتة جمع بيانات الأداء وتحليلها الأولي، فإن القادة يكفّون عن العمل كأرشيفيين للتقييمات ويتحولون إلى دور المدربين الاستراتيجيين. وهذا التحرر في الوقت ليس هامشياً: فالمنظمات التي استثمرت في التدريب المكثف لفرقها تُفيد بأن القادة يستردون ساعات مهمة كانت تُستنزف في الإجابة عن استفسارات تشغيلية ذات قيمة منخفضة.

غير أن النظام يصطدم بحدٍّ هيكلي تميل رواية البيانات المستمرة إلى إخفائه. فالقياس المتكرر لا يحل مشكلة ما يُقاس أصلاً. فإن كانت المقاييس التي تلتقطها الذكاء الاصطناعي تعكس بصورة رئيسية سرعة الاستجابة وحجم المخرجات والوفاء بالمهام الروتينية، فإن التقييم المستمر لا يُنتج صورة أكثر ثراءً عن الموظف: بل يُنتج صورة أكثر دقةً لأنشطته الأكثر سطحية. والفرق بين الأمرين، استراتيجياً، هائل.

ثمة أيضاً خطر رصده باحثون في إدارة المواهب بوضوح متصاعد: حين تكون أنظمة التقييم مرتبطة مباشرةً بأهداف أداء طموحة والمتابعة متواصلة، فإن الأثر الناجم ليس تحفيزاً مستداماً بل ضيقاً في مدى التركيز. تكف الفرق عن التجريب، وتكف عن تحمّل المخاطر الضرورية للتعلم، وتُركّز طاقتها على المقاييس التي تعلم أنها تخضع للمراقبة. والنتيجة، الموثقة في أبحاث حول أهداف الأداء العالي، هي أن المدى القصير يبدو حسناً فيما يتدهور المدى المتوسط في صمت.

المشكلة الحقيقية ليست التكنولوجيا، بل هي الغرض من النظام

يستطيع أي مؤسسة تطبيق أكثر أنظمة التقييم المستمر تطوراً في السوق وتظل عاجزة عن الإجابة عن سؤال تشغيلي بسيط: لماذا تقيس ما تقيسه. هذا ليس انتقاداً للأداة في حد ذاتها. إنه ملاحظة حول الفرق بين تنصيب بنية تحتية وبناء قدرة على اتخاذ القرار.

هذا التمييز مهم لأن أنظمة التقييم المستمر ليست محايدة. إنها تُنتج تبعات ثقافية تعتمد اعتماداً مباشراً على كيفية تصميمها والإشارات التي ترسلها للموظفين حول ما تُقدّره المنظمة. فإن كان النظام يجمع البيانات دون أن يحوّلها إلى محادثات تطويرية ملموسة، فما يتلقاه الموظفون ليس تغذية راجعة: إنه مراقبة. والمراقبة، حتى حين تكون بنوايا حسنة، لها أثر متوقع على الأمان النفسي للفرق.

كشفت أبحاث السلوك التنظيمي أنه حين يُطلب من الأفراد تقديم ملاحظات حول أداء زميل، فإن جودة تلك الملاحظات تتحسن بشكل ملحوظ إذا صِيغ الطلب باعتباره استشارة لا تقييماً. الاستشارة تتوجه نحو المستقبل وتُولّد توصيات عملية وتُحفّز الرغبة في المساعدة. أما التقييم فيتطلع إلى الوراء ويُفعّل آليات الدفاع. وحتى يُنتج نظام التقييم المستمر تطويراً حقيقياً، يجب أن تُصمَّم التفاعلات الإنسانية المحيطة بالبيانات وفق هذا المنطق، لا شاشات التحليل وحدها.

ثمة أيضاً بُعد حوكمة تُقلّل منه المنظمات. مع اكتساب أنظمة الذكاء الاصطناعي موطئ قدم في تقييم الأفراد، يصبح التساؤل حول كيفية توليد الدرجات، والتحيزات التي تتضمنها الخوارزميات المُدرَّبة على بيانات تاريخية، والحقوق التي يملكها الموظفون تجاه هذه المعلومات، تساؤلاً لا مفر منه. وهو ليس سؤالاً تنظيمياً مجرداً: إنه سؤال ثقة تشغيلية. فالموظف الذي لا يفهم كيف قيّمه نظام آلي لا يستطيع أن يُصحّح سلوكياته بصورة ذات معنى. بل إنه قد يتعلم تحسين المؤشرات المرئية، في حين يُهمل تلك التي لا يرصدها النظام.

والمنظمات التي تُطبّق هذه الأنظمة دون بنية شفافية وقابلية للتفسير تتراكم لديها ديون ثقة ستُؤدّي ثمنها لاحقاً في الاحتفاظ بالموظفين والتعاون والاستعداد للتعلم.

حين يحلّ تكرار القياس محلّ الحكم الاستراتيجي

ثمة منطق ضمني يكمن وراء التبني الواسع لأنظمة التقييم المستمر يستحق أن يُمحَّص بعناية. يقول ذلك المنطق إنه مع توافر بيانات أكثر وأكثر تكراراً وأشد تفصيلاً، ستُتخذ قرارات أفضل بشأن الأفراد. هذا منطق يستقيم في المجالات التي تكون فيها المتغيرات المعنية مستقرة، ونموذج القياس متيناً، والرابط بين المؤشر والنتيجة المُستهدفة راسخاً.

في إدارة المواهب، لا يتحقق أيٌّ من هذه الشروط الثلاثة بصورة تلقائية. فالقدرات البشرية سياقية بطبيعتها: قد يؤدي شخص ما أداءً متوسطاً في دور مُصمَّم تصميماً رديئاً، ثم يُبلي بلاءً استثنائياً في دور آخر. ونماذج القياس تستورث تحيزات مصمميها والبيانات التاريخية التي دُرِّبت عليها. والرابط بين مؤشرات المدى القصير التي ترصدها الأنظمة والنتائج التنظيمية بعيدة المدى التي تُعنى بها هو، في أحسن الأحوال، جزئي.

هذا لا يُلغي فائدة أنظمة التقييم المستمر. لكنه يُلغي صلاحيتها بوصفها بديلاً عن الحكم الاستراتيجي في شأن الأفراد. وذلك التمييز تحديداً هو ما تفوّته كثير من المنظمات في خضم حماسة التطبيق.

التحذير الذي يُدرجه شودري ووينسور في حجتهما، وهو أن على المنظمات أن تكون حذرة في كيفية تطبيق هذه الأنظمة، ليس تفصيلاً هامشياً. إنه صميم المشكلة. لأن كيفية التطبيق ليست متغيراً تقنياً: إنها متغير غرض وهدف. منظمة تُطبّق التقييم المستمر بدافع خفض تكاليف المراجعة السنوية وتحسين توزيع الأفراد على المشاريع تفعل شيئاً مغايراً جوهرياً لمنظمة تُطبّقه بهدف رصد فجوات التعلم وتسريع التنقل الداخلي وإجراء محادثات تطويرية أعلى جودة. كلتاهما قادرتان على اقتناء المنصة ذاتها. لكن النتائج الثقافية والاستراتيجية ستكون مختلفة.

الخطر الذي أشار إليه محللو غارتنر للعام 2026 يُجسّد هذه المسألة بجلاء: فالذكاء الاصطناعي قادر على إيجاد ظروف تشغيلية تُذكي ضغوط أداء غير مستدامة، مما يُآكل النتائج على المدى البعيد في حين تبدو مؤشرات المدى القصير في موضع قوة. وهذا نمط معروف في مجالات إدارية أخرى: يُحسَّن ما يُقاس، ويُهجر ما لا يظهر على لوحة القيادة، وتتعلم المنظمة في صمت أن تبدو حسنة في التقارير بينما تُفقد جوهرها في العمليات التي لا تحتل عموداً في جدول البيانات.

الخيار الذي لا يستطيع أي نظام اتخاذه عوضاً عن المنظمة

ثمة شيء لا تستطيع أفضل أنظمة التقييم المستمر القيام به: تحديد نوع المنظمة التي يريد مستخدموها أن يكونوا. فهي لا تستطيع الفصل فيما إذا كان الغرض من التقييم هو الضبط أم التطوير. ولا تستطيع تحديد ما إذا كانت البيانات ستُستخدم لفتح الحوارات أم لإغلاقها. ولا تستطيع الحكم على ما إذا كان مقياس سرعة التعلم أكثر أهمية من مقياس الوفاء بالأهداف الفصلية أم أقل.

تلك قرارات معمارية تنظيمية، وهي سابقة على أي خيار تكنولوجي. والشركات التي تتبنى منصات التقييم المستمر دون أن تتخذ هذه القرارات صراحةً لا تتهوّر بدافع الجهل. تتهوّر لسبب أكثر شيوعاً: فالاستعجال في التطبيق يُولّد وهم أن النظام سيتخذ تلك القرارات من تلقاء نفسه، أو أن بالإمكان تأجيلها. لكن التجربة المتراكمة في التحولات التنظيمية تقترح أنه حين يُرجأ الاتفاق على الغرض، يتبنى النظام الغرض الافتراضي للسياق الذي يعمل فيه. وفي معظم المنظمات، ذلك الغرض الافتراضي هو ضبط الأداء لا تطويره.

اللحظة التي تسبق قرار التطبيق، تلك المساحة التي يجب فيها على المنظمة أن توضح ماذا ستفعل بالبيانات التي ستحصل عليها، وأي محادثات ستُولّدها، وكيف ستحمي ثقة الأفراد الخاضعين للتقييم، وبأي نوع من القرارات لن تربط نتائج النظام، هي اللحظة الاستراتيجية الحقيقية. لا اختيار المورد ولا تصميم لوحة المؤشرات.

المنظمات التي تصل إلى تلك اللحظة وهي تمتلك إجابات واضحة حول الغرض والحدود وطريقة استخدام المعلومات لن تكون مجرد مُطبِّق أفضل للتكنولوجيا. ستكون بانيةً لنظام تقييم قادر على إدارة التعلم التنظيمي تحت الضغط، وهو بالضبط ما يجعله ضرورة لا غنى عنها في ظل التسارع المتصاعد للذكاء الاصطناعي في بيئة العمل. أما التي تؤجل هذه القرارات، فستكتشف، بيانات عالية التكرار ودقة تفصيلية، أنها قاست كل شيء وفهمت القليل.