الخوارزمية التي تهدد بضعف سوق الذاكرة

عندما تلتهم كفاءة البرمجيات الطلب على الأجهزة

في بداية هذا العام، كانت أسواق أشباه الموصلات تعمل تحت افتراضٍ بدا متناغماً كما هو السيليكون نفسه: نمو الذكاء الاصطناعي سيضمن طلباً مستداماً وشغوفاً على الذاكرة. مزيد من النماذج، مزيد من المعلمات، مزيد من الاستدلالات المتزامنة. كانت المنطق خطياً ومطمئناً لمستثمري ميكرون وسنديسك. ثم نشرت جوجل TurboQuant.

لم يصل إعلان فريق البحث في جوجل كإعلان حرب، بل كبحث تقني. TurboQuant هو خوارزمية ضغط متطرف يمكنها، وفقاً لمهندسي الشركة، أن تقلل استخدام الذاكرة للنماذج اللغوية الكبيرة حتى ست مرات دون تدهور مميز في أدائها. استغرق السوق ساعات قليلة لمعالجة التداعيات: سجلت أسهم ميكرون وسنديسك انخفاضات حادة. لكن هنالك سؤال هيكلي لا تزال قليل من الأصوات طرحته بشكل جاد.

ما تكشفه TurboQuant ليس مجرد تهديد عابر لاثنين من الأسهم المخترقة، بل إنه يمثل أوضح تجسيد حتى الآن لتوتر يعرف أعمال البنية التحتية التكنولوجية: كفاءة الخوارزمية وطلب الأجهزة قوتان تتنازعان، وعندما تتقدم واحدة بما فيه الكفاية، تتراجع الأخرى.

الحسابات التي يُفضل منتجو الشرائح تجاهلها

لفهم حجم الضربة، يجب التفكير في اقتصاديات قياس الاستدلال. اليوم، يستلزم نشر نموذج لغوي كبير في الإنتاج كميات هائلة من الذاكرة عالية السرعة، النوع الذي تصنعه تحديداً ميكرون وسنديسك. كل استعلام، كل جيل نصي، كل تحليل صورة يتطلب عرض نطاق ترددي لذاكرة يتناسب مع حجم النموذج. كانت مراكز البيانات في شركات التكنولوجيا الكبرى لسنوات توسع في سعة ذاكرتها لتلبية هذا الطلب.

إذا كان TurboQuant يسمح لتلك النماذج ذاتها أن تعمل بمقدار سدس الذاكرة الحالية، فإن النتيجة المباشرة ليست في شراء عدد أقل من الشرائح غداً، بل في أن وتيرة النمو في الطلب ستتراجع بشكل ملموس. قد يتمكن مشغل سحاب كان يخطط لمضاعفة مخزونه من الذاكرة في غضون سنتين، الآن من تأجيل هذا الاستثمار. قد يتمكن مشغل يتوقع تجديد بنيته التحتية من تمديد دورة حياتها.

في صناعة أشباه الموصلات، حيث تقاس دورات الاستثمار بالسنوات وتكلف المصانع عشرات المليارات من الدولارات، فإن تلك التباطؤ لا تمثل مجرد قصة عابرة: إنها خطر دورة كاملة.

لدى المحللين الذين ينصحون بالشراء عند الانخفاض جزء من الحق في الأفق القريب. الطلب على الذاكرة لا ينهار بين عشية وضحاها، وسيستغرق اختراق TurboQuant في النشر الفعلي وقتاً. ولكن هذا الحجة التكتيكية لا تحل السؤال الاستراتيجي الأساسي: إذا ما ترسخ هذا النمط، وإذا ما تعلمت صناعة الذكاء الاصطناعي كيفية القيام بأكثر باستخدام ذاكرة أقل بشكل نظامي، فإن سقف تقييم شركات تصنيع شرائح الذاكرة سيُعيد تقييمه نحو الأسفل بشكل دائم، وليس مؤقت.

هنا تأتي أهمية نموذج العدالة بشكل أكبر من تحليل الم multiples السهم. لقد بنت ميكرون وسنديسك موقعهما التنافسي على فرضية ضمنية: أن الطلب على منتجاتها سينمو بنسبة مباشرة مع نمو الذكاء الاصطناعي. كانت تلك الفرضية رهاناً على عدم كفاءة دائمة للبرمجيات. وقد أثبتت جوجل أن تلك الفوضى كانت قابلة للتصحيح.

القيمة تتحرك، لا تختفي

سيكون من الخطأ قراءة هذه الحركة كدمار خالص للقيمة. ما يفتتحه TurboQuant هو تحول: القيمة الاقتصادية تهاجر من ذاكرة الأجهزة إلى طبقة البرمجيات وخوارزميات التحسين. جوجل لا تدمر سوق الشرائح؛ بل تستولي على جزء من القيمة التي كانت تُوزع سابقاً عبر سلسلة إمدادات الأجهزة.

هذا النمط ليس جديداً في مجال التكنولوجيا. كلما نجحت طبقة من البرمجيات في جعل العمل أفضل باستخدام الأجهزة الحالية، يعاد توزيع القوة التفاوضية إلى الأعلى في السلسلة التكنولوجية. ما يتغير مع TurboQuant هو سرعة وحجم هذا التحول، وحقيقة أن هذا يأتي من أحد أكبر المشترين في العالم لهذا الجهاز، والذي أصبح الآن أقل حاجة.

بالنسبة لمصنعي الشرائح، لا يمكن أن تقتصر الاستجابة الاستراتيجية على الانتظار حتى يعوض الطلب المجمع على الذكاء الاصطناعي تأثير الحجم. تعمل تلك المنطق طالما أن السوق ينمو بمعدلات متفجرة، ولكن ليس ميزة تنافسية دائمة: إنها رهان على النمو الأبدي. الشركات التي تبقى خلال دورات الكفاءة التكنولوجية هي تلك التي تتنوع نحو تطبيقات تكون فيها الكثافة الذاكراتية ليست معياراً يتم تحسنه بسهولة: معالجة الأطراف الشبكية، أجهزة ذات زمن استجابة منخفض، وهياكل ذاكرة متطورة.

هناك قراءة أيضا للشركات التي تقوم بنشر الذكاء الاصطناعي والذين حتى الآن كانوا يحسبون تكاليفهم التشغيلية على أساس أن فاتورة الذاكرة ثابتة وغير متحركة. إذا ما تحقق ما يعد به TurboQuant في بيئات الإنتاج الحقيقية، فإن تكلفة الاستدلال لكل استعلام ستنخفض بشكل كبير. بالنسبة للشركات الناشئة التي تبني على نماذج لغوية والتي تحرق الآن رأس المال في دفع تكاليف البنية التحتية، قد يكون هذا الضغط على التكاليف الفرق بين نموذج عمل قابل للحياة وآخر يعتمد باستمرار على الجولة التالية من التمويل. الكفاءة الخوارزمية، في هذه الحالة، لها قيمة أكبر للأطراف الصغيرة من الأضخم منها: بل تمكّنهم من العمل دون دعم من ميزانية بمليارات.

العائد الحقيقي للضغط ليس للمستثمرين في الشرائح

هناك بُعدٌ من هذه القصة يُفوتها التحليل المالي التقليدي لأنه لا يظهر في النتائج قصيرة الأجل. عندما ينخفض تكلفة نشر الذكاء الاصطناعي بشكل مادي، فإن عتبة الوصول للمنظمات ذات الموارد المحدودة تنخفض أيضاً. المستشفيات في الأسواق الناشئة، التعاونيات الزراعية، الحكومات المحلية ذات الميزانيات المحدودة: جميعها اليوم تعمل خارج متناول نماذج الذكاء الاصطناعي الأكثر قدرة، جزئياً لأن البنية التحتية للذاكرة اللازمة لتشغيلها تُعتبر مكلفة.

إن خوارزمية تقلل من هذا الطلب بمقدار ست مرات ليست مجرد خبر للتجار في مجال أشباه الموصلات. إنها ضغط في تكلفة دخول إلى تقنية يمكن، إذا استخدمت بشكل صحيح، تحسين التشخيصات، تحسين سلاسل توزيع الغذاء، أو جعل إدارة الموارد العامة أكثر كفاءة. إن هذا التأثير لا يُحتسب في سعر سهم جوجل ولا في انخفاض ميكرون. بل يبقى في هيكل الوصول إلى المعرفة الذي نبنيه، تقريباً دون انتباه، من خلال قرارات تقنية تبدو محايدة.

فالرواد في عالم الأعمال الذين يقرؤون هذه القصة فقط كدورة قطاعية قادرون على ترك السؤال الأهم على الطاولة: هل يوجد نموذج عملهم لاستخراج أقصى قيمة ممكنة من دورة الأجهزة، أم أن لديهم الجرأة الاستراتيجية لاستخدام الكفاءة كوقود لتوسيع الوصول، وتقليل عوائق الدخول، وبناء موقع تنافسي لا يعتمد على كون السوق مستمراً في كونه غير فعال إلى الأبد؟