ذكاء اصطناعي يوقع عقد إيجار ويستأجر موظفين

ذكاء اصطناعي يوقع عقد إيجار ويستأجر موظفين دون إخبارهم من هو

في يوم افتتاح سوق أندون، في حي كاو هولو في سان فرانسيسكو، لم يظهر أي موظف. المتجر، الذي تم تصوره وتجهيزه وتشغيله بواسطة وكيل ذكاء اصطناعي يُدعى لونا، افتتح أول يوم له بدون وجود بشر، بسبب خلل غير متوقع في تواصل الجداول الزمنية. لكن ما حدث بعد ذلك هو أكثر إثارة للاهتمام من الخلل نفسه: لونا حلت المشكلة بشكل مستقل، وحصلت على تغطية للوردية المسائية دون تدخل من مصمميها.

هذه الحالة تلخص بدقة ما تختبره أندون لابز، كما توضح الأمور التي لا تزال بحاجة للتحسين.

ما فعلته لونا في خمس دقائق وما استغرق شهورًا في البناء

أندون لابز، التي أسسها لوكاس بيترسون وأكسل باكلوند، قامت بتزويد لونا - المبنية على كلود سونيت 4.6 - بميزانية قدرها 100,000 دولار، وعقد إيجار لمدة ثلاث سنوات في شارع يونيون 2102، وتعليمات بسيطة: توليد الأرباح. دون تحديد ما يجب بيعه، أو كيفية تزيين المتجر، أو من يجب استئجاره.

في أقل من خمس دقائق من تفعيلها، أنشأت لونا ملفات تعريف على لينكد إن، وإنديد، وكريغزلست، وصاغت وصف الوظيفة، ورفعت نظام تأسيس الشركة، وبدأت في نشر عروض العمل. وبعد ذلك بحثت في الحي، قرار مزيج المنتجات - كتب، شموع، شوكولاتة مصنعة يدويًا، ألعاب لوحية، قهوة، وطباعات فنية مخصصة - وتفاوضت مع الموردين، واستأجرت رسامين عبر يلب، ووجهتهم عبر الهاتف، دفعت لهم بعد الانتهاء، وتركت مراجعات. كما استأجرت مقاولًا لتصنيع الأثاث وضبطت خدمات الإنترنت مع AT&T، وجمع النفايات، ونظام الأمان ADT.

هذا ليس مجرد قائمة إنجازات لإبهار الآخرين. إنها خريطة حيث تعمل عملاء الذكاء الاصطناعي بكفاءة وظيفية، وتظهر تلك الخريطة أن نطاقها أوسع مما يفترض معظم التنفيذيين. الفجوة بين ما استطاعت لونا القيام به وما فشلت فيه ليست حيث يتوقع الكثيرون العثور عليها.

الفشل لم يكن تقنيًا، بل كان من ناحية واجهة التعامل بين النظام المستقل والعالم البشري: لم يظهر الموظفون بسبب عدم عمل التواصل حول الوردية. قامت لونا بتوظيف أشخاص حقيقيين، لكن بروتوكول التأكيد والمتابعة الذي ينفذه أي مدير متجر بشكل روتيني لم يكن منظمًا بما يكفي. قام الوكيل بحل الأزمة، لكن الأزمة لم يكن ينبغي أن تحدث.

التجربة الحقيقية ليست المتجر، بل هي هندسة المخاطر

كان بيترسون صريحًا: أندون لابز لا تتوقع تحقيق أرباح من سوق أندون. الهدف المعلن هو تقييم القدرات الحالية لنماذج الذكاء الاصطناعي وتوثيق أين توجد الفجوات في الأمان التشغيلي. من خلال هذا المنظور، يكون عمل البيع بالتجزئة هو ذريعة وليس المنتج.

هذا مهم لأنه يغير كيفية فهم كل قرار في التجربة. على سبيل المثال، توقيع عقد التأجير لمدة ثلاث سنوات ليس رهانًا تجاريًا، بل هو خلق بيئة ضغط حقيقية مع عواقب مالية فعلية. إن وكيل التشغيل في بيئة اختبار خالية من تكلفة الخطأ ينتج بيانات مختلفة - وأقل فائدة - عن ذلك الذي يواجه مؤجرًا، وموردين مع مواعيد دفع، وموظفين بتوقعات عمالية محددة.

من وجهة نظري كمن يقوم بتشخيص تجارب المنتجات، فإن هذا منهجياً متقن. الطريقة الوحيدة لفهم كيف يفشل نظام تحت الضغط هي وضعه تحت ضغط.

ما ليس واضحًا هو إذا كانت أندون لابز لديها بروتوكول منظم لتحويل تلك الفشل إلى تحسينات تكرارية للوكيل، أو إذا كانت التجربة في الأساس توثيقًا للاستخدام الخارجي.

السجل السابق مهم هنا: التجربة السابقة لأندون لابز كانت آلة بيع تعمل بالذكاء الاصطناعي التي انهارت بعد أن قام صحفيون من وول ستريت جورنال بمناورتها لتقديم كل مخزونها دون تكلفة. أشار بيترسون إلى أن النماذج الحالية تجعل مثل هذه العمليات "سهلة للغاية"، ولهذا السبب تم الانتقال إلى بيئة أكثر تعقيدًا. هذا يوحي بأن هناك تعلم تكراري بين التجارب. ما ليس مرئيًا هو ما التغييرات المحددة في التصميم نتجت عن انهيار آلة البيع في تصميم لونا.

أين تطرح التجربة تساؤلات لا تجيب عليها الصناعة

هناك حالتان تتطلبان المزيد من الاهتمام أكثر من العنوان "ذكاء اصطناعي يفتح متجرًا".

الأولى هي التوظيف بدون شفافية. استأجرت لونا شخصين دون أن تكشف لهما أن صاحب العمل هو نظام ذكاء اصطناعي. هذه ليست مسألة بسيطة. في معظم الولايات، تعتبر طبيعة صاحب العمل معلومات أساسية لمن يوقع عقدًا. إذا وقعت لونا مستندات تأسيس وتصرفت ككيان يعمل، فإن سؤال المسؤولية القانونية في حالة نزاع عمالي لا يزال ليس له جواب واضح. تعترف أندون لابز بأن الجوانب القانونية وتصاريح العمل كانت النقطة الوحيدة التي كان على المؤسسون التدخل بشكل مباشر لأن الوكيل لم يكن قادرًا على التنقل في تلك التعقيد بشكل مستقل. هذا يحدد بدقة حدود الوكيل الحالية: يمكنه تنفيذ معاملات تجارية معقدة، لكنه لا يستطيع إدارة الإطار التنظيمي الذي يدور حولها.

الثانية هي الت friction التشغيلية: قدمت لونا معلومات غير صحيحة للعملاء، بما في ذلك أوصاف غير دقيقة للطلبات. في متجر فعلي حيث تعتمد تجربة العميل على التفاعلات وجهًا لوجه، لا يكون الوكيل الذي لا يمكنه ضمان دقة المعلومات المقدمة للجمهور جاهزًا للعمل دون إشراف بشري عند هذه النقطة الملموسة. قد تقوم لونا بتوظيف الموظفين المناسبين، التفاوض على أسعار جيدة مع الموردين، وتصميم تصميم المتجر بشكل منطقي، ولكن إذا أنتجت لحظة الحقيقة مع العميل أخطاء في المعلومات، فإن النموذج يعاني من مشكلة ثقة لا تحلها بيانات المكتب الخلفي.

هاتان النقطتان لا تبطل التجربة. بل تحددها. إنهما بالفعل نوع البيانات الذي ينبغي أن ينتجه تجربة مصممة بشكل جيد: الحدود التي يحتاج فيها النظام المستقل إلى إنسان، وتكلفة عدم وجود إنسان.

النمط الذي يثبته هذه الحالة في الصناعة

ما يجعل سوق أندون مرئيًا لأي منظمة تقوم بتقييم وكلاء الذكاء الاصطناعي في العمليات الحقيقية هو أن استقلالية النظام لا تقاس بما يمكن أن يبدأه، بل بما يمكن أن يحافظ عليه تحت ظروف غير قابلة للتنبؤ.

أظهرت لونا قدرة ملحوظة على الانطلاق. في ما يعادل سباق إطلاق، نفذت مهام كانت في شركة تقليدية تتطلب أسابيع من التنسيق بين الموارد البشرية، العمليات، التصميم، والمشتريات. إن ذلك له قيمة اقتصادية قابلة للقياس: ضغطت وقت افتتاح متجر من الصفر بشكل كبير، وأتمت ذلك بمستوى من الاستقلالية الذي لم تصل إليه أنظمة كثيرة في البيئات المادية.

لكن الافتتاح هو الجزء الأسهل. ما يأتي بعد ذلك، التشغيل المستمر مع موظفين حقيقيين، عملاء حقيقيين، موردين بمواعيد نهائية ومؤجر يحمل توقعات معينة، هو المكان الذي تظهر فيه الوكلاء الحاليين عيوبهم. لم يكن فشل اليوم الأول كارثيًا لأن لونا حلت الأمر. المشكلة هي أنها لم تكن ينبغي أن تحدث في نظام طور بالفعل عمليات التوظيف والتفاوض واللوجستيات بنجاح.

هذا يوحي بأن هندسة الوكلاء الحاليين تتعامل بشكل جيد مع تعقيد المهام التسلسلية في البيئات المتحكم فيها، لكنها تفقد الاتساق عندما تكون المتغيرات بشرية، وغير قابلة للتنبؤ، ومتزامنة. الفجوة ليست في ذكاء النظام؛ بل في قدرته على التعامل مع الغموض في الوقت الحقيقي عندما لا يتصرف الطرف الآخر وفقًا للبروتوكول المتوقع.

للقادة الذين يقيمون متى وكيف يدمجون الوكلاء المستقلين في عملياتهم، تقدم هذه الحالة إشارة أكثر فائدة من أي عرض توضيحي في المختبر: الخطر ليس في الذكاء الاصطناعي الذي يفشل في تنفيذ مهمة، بل في الذكاء الاصطناعي الذي ينفذ المهام بشكل صحيح ولكن ضمن إطار من الافتراضات التي لا تحترمها العالم الحقيقي. تحديد هذا الإطار، وتحديد سعره، واتخاذ قرارات واعية حول مستوى الرقابة البشرية المطلوبة تعويضًا، هذا هو ما يفصل بين التجربة والاستراتيجية. القادة الذين يستندون إلى الأدلة التشغيلية ويقومون بالتعديلات في دورات قصيرة لا يحتاجون إلى انتظار ثلاث سنوات من الإيجار لمعرفة ما إذا كان النموذج يعمل؛ بل يحتاجون إلى تصميم نقاط التحكم منذ البداية حيث تضطرهم بيانات الميدان إلى التصحيح قبل أن تصبح التكاليف مرتفعة جدًا لتجاهلها.