المشكلة التي لم يستطع أي مستشفى حلها بمفرده
خلال أسوأ شهور الجائحة، واجهت المستشفيات في جميع أنحاء العالم نفس التناقض التشغيلي: كان لديهم بيانات كافية لتدريب نماذج ذكاء اصطناعي تستطيع التنبؤ بأي المرضى سيتدهور، لكن لم يتمكنوا من مشاركتها. وشكل قانون حماية البيانات الصحية (HIPAA) في الولايات المتحدة، والتوجيه العام لحماية البيانات (GDPR) في أوروبا، واللوائح المعادلة في عشرات الدول، كل ذلك كان يمنع نقل السجلات بسبب المخاطر القانونية المُحتملة، مما يعرّضهم لمسؤوليات بملايين الدولارات. كان الناتج هو تَفَرُّق عبثي: كل مؤسسة كانت تدرب نماذجها الخاصة باستخدام عينات صغيرة، مما يؤدي إلى أدوات كانت تعمل جيدًا ضمن جدرانها وتسقط عند الانتقال إلى مكان آخر.
وتمكن نموذج "EXAM" - الذي تم تطويره بشكل تعاوني بين 20 مستشفى - من معالجة هذا التناقض من خلال هيكله المعماري. لم يطلب البيانات، بل طلب شيئًا أكثر ذكاءً: الدروس التي تم استخراجها من تلك البيانات.
باستخدام التعلم الفيدرالي، قام كل مستشفى بتدريب النموذج محليًا على صور الأشعة السينية والتاريخ الطبي، ثم شارك فقط التحديثات الرياضية للنموذج، وليس سجلات المرضى. استوعب النموذج العالمي التعلم الموزع من 20 مصدرًا مختلفًا دون عبور أي بيانات حدودًا مؤسسية. كانت النتيجة هي زيادة بنسبة 16% في الدقة و38% في التعميم مقارنة بالنماذج المدربة بطريقة مركزية باستخدام مجموعات بيانات متجانسة. هذه الفروق ليست هامشية إحصائيًا: في تقييم رعاية الطوارئ، كل نقطة مئوية من الدقة يمكن أن تحمل اسمًا.
لماذا التعميم أكثر أهمية من الدقة المحلية
المؤشر الذي يثير اهتمامي في "EXAM" ليس نسبة الزيادة البالغة 16% في الدقة، بل هو نسبة الزيادة التي تصل إلى 38% في التعميم. هنا يكمن الحجة الاستراتيجية التي يغفلها معظم التحليلات لهذه الأداة.
إذا كان نموذج ذكاء اصطناعي في الصحة يعمل بشكل جيد في المستشفى الذي تم تدريبه فيه ولكنه يفشل في مركز آخر، فإن قيمته التجارية تكاد تكون صفرًا خارج هذا السياق. بشكل عملي، هو أصل غير قابل للنقل. عندما طور مستشفى "NYU Langone" نموذجه الخاص باستخدام 5200 أشعة سينية وحقق دقة تصل إلى 80% في التنبؤ بالتقدم الشديد لكوفيد-19، فقد بنى أداة قوية للمستشفى. السؤال غير المُجاب هو: ما نسبة من هذا الأداء التي تبقى مع تغيير ديموغرافيا المريض، أو البروتوكول للصورة، أو المعدات الشعاعية؟
عندما تم تدريب "EXAM" في الوقت نفسه على تباين 20 مؤسسة مختلفة مع تجمعات سكانية متنوعة، فقد أنشأ نموذجاً قد رأى بالفعل تفاوتًا. لا يحتاج إلى تعميمه بعد ذلك لأنه استوعبه خلال التدريب. وهذا له تأثير مباشر على أي مستشفى تفكر في اعتماد أدوات من هذا النوع: نموذج يزيد بنسبة 38% في التعميم يقلل بشكل كبير من تكلفة إعادة التدريب المحلي، والتي يمكن أن تمثل بين 30% و60% من ميزانية التنفيذ لمشاريع الذكاء الاصطناعي الطبية.
إن البنية الفيدرالية ليست مجرد آلية للامتثال للخصوصية. إنها آلية لخفض التكاليف المتغيرة لكل عقد مشارك.
اقتصاد التعاون دون الحاجة للثقة
ما أنشأه "EXAM" هو، من حيث هيكل الحوافز، شيء تحاول الصناعة الدوائية تحقيقه لعقود دون نجاح: تعاون تنافسي دون تنازل عن الأصول الاستراتيجية. كل مستشفى تنازلت عن التعلم لكنها احتفظت بالبيانات، والتي تمثل المادة الخام التي تدعم مكانتها في النماذج المستقبلية.
يحل هذا الهيكل مشكلة حوكمة كانت قد أوقفت عشرات المبادرات المماثلة. المستشفيات الجامعية لا تشارك البيانات السريرية مع المؤسسات المتنافسة، ليس لأنها منظمات خبيثة، بل لأن بيانات المرضى تُعتبر أصولاً مُنظمة، وأصولًا للبحث، وعبئًا قانونيًا. أي نموذج للتعاون يتطلب التخلي عن هذا الأصل يواجه حاجزًا مؤسسيًا لا يمكن تجاوزها بواسطه أي عقد حسن نية.
إن التعلم الفيدرالي يقضي على هذا الحاجز. وعند القضاء عليه، يفتح إمكانية بناء نماذج على نطاق عالمي استنادًا إلى بيانات التي ستظل في نُظم مُعزولة. طوّر مستشفى "Massachusetts General" نظامه الخاص لتقييم شدة الرئة المُدرَّب على أكثر من 224000 صورة أشعة من مجموعة بيانات "CheXpert" من جامعة ستانفورد، وتم تحسينه على 314 حالة كوفيد. هذا جهد كبير في هندسة البيانات من أجل عينة، في سياق "EXAM"، ستكون عقدة واحدة أخرى في الشبكة.
إن الفرق في النطاق ليس تقنيًا فقط. إنه فرق في نوع الأسئلة التي يمكن لكل نموذج أن يجيب عليها بشكل موثوق. النماذج المدربة على عشرات الآلاف من صور الأشعة من مصدر واحد تجيب جيدًا على الأسئلة المتعلقة بذلك المصدر. النماذج المدربة على تباين 20 نظامًا صحيًا مختلفًا تجيب على الأسئلة المتعلقة بالشرط البشري بشكل عام.
أظهرت meta-analysis لتسعة دراسات حول الذكاء الاصطناعي المُطبق على الأشعة السينية للصدر في كوفيد-19 منطقة تحت المنحنى تبلغ 0.98، وهو رقم سيكون استثنائيًا في أي سياق تشخيصي آخر. تشير نفس التحليل إلى أن 22% فقط من الدراسات المراجعة استخدمت التحقق الخارجي. ومن ثم، فإن 78% الباقية بَنَت أدوات لم يتم اختبارها خارج السياق الذي وُلِدت فيه.
النموذج الذي يحتاج القطاع الصحي لنسخه
هناك نمط هيكلي في كيفية فشل رقمنة الصحة يميل "EXAM" إلى كسره مباشرة. تُنتج الجمود المعتاد صناعة حيث يطور كل مركز مستشفى كبير أداة الذكاء الاصطناعي الخاصة به، وعادةً ما تكون بتمويل بحوث غير قابلة للاسترداد، بدون هيكل للت Monetization، مع قدرة صيانة ضعيفة بعد النشر. النتيجة هي مقبرة لنماذج أكاديمية صلبة وعملية مُعطلة.
يفتح الهيكل الفيدرالي منطقًا جديدًا. يمكن لتحالف من المستشفيات الذي يشارك تحديثات النموذج - وليس البيانات - دعم أصل جماعي تتوزع تكلفة صيانته بين جميع المشاركين في حين يتوسع الفائدة مع كل عقد إضافي. إن هذا نموذج للتكاليف بخصائص معينة تختلف تمامًا عن التطوير الخاص المعزول.
بالنسبة للتنفيذيين في القطاع الصحي الذين يُقيّمون الاستثمارات في الذكاء الاصطناعي السريري، فإن السؤال التشغيلي ليس ما إذا كانوا سيتبنون هذه الأدوات. بل هو ما إذا كان مؤسستهم تصمم هذه الأدوات لتبقى محصورة في جدرانها أو لتصبح أكثر دقة مع كل شريك جديد ينضم إلى الشبكة. نموذج يتحسن مع مرور الوقت دون التنازل عن خصوصية المريض ليس مجرد ميزة تكنولوجية؛ إنه الهيكل المالي القابل للاستدامة في الذكاء الاصطناعي الطبي على المدى الطويل.
إن القادة الذين يتخذون حاليًا قرارات بشأن الهيكل التكنولوجي في الصحة يختارون بين بناء أصول تتقادم في العزلة أو بناء أصول تتقدَّم من خلال التعاون. وتظهر أدلة "EXAM" أن الخيار الثاني يقدم عوائد أكثر وأقل تكلفة في الصيانة ولا يتطلب التضحية بأي أصول حساسة لتحقيق ذلك. هذه هي التدقيق الذي يجب أن يخضع له كل مستوى من مستويا ذوي النفوذ في القطاع الصحي قبل توقيع العقد التالي للذكاء الاصطناعي: ما إذا كان نموذج استثمارهم التكنولوجي يستخدم بيانات مرضاهم كمادة خام تتبقى محصورة، أو أن لديه الهيكل لتحويل تلك المعلومات إلى وقود يعزز القدرة التشخيصية للشبكة بأكملها من حولهم.













