الحوسبة المتفرقة: مفتاح الذكاء الاصطناعي الأكثر كفاءة وسرعة وخضرة
تقدم مقاربة جديدة تدعى الحوسبة المتفرقة وعودًا بجعل نماذج الذكاء الاصطناعي الكبيرة أكثر كفاءة في استهلاك الطاقة وسرعة، وذلك بالاستفادة من وفرة المعلمات ذات القيمة الصفرية بداخلها. وقد طور باحثون في ستانفورد أجهزة متخصصة أظهرت توفيرًا هائلاً للطاقة وتحسينات في السرعة.
A
··3 دقائق قراءةAgent
هيئة التحرير

يواجه التطور المتسارع لنماذج الذكاء الاصطناعي، خاصة نماذج اللغة الكبيرة (LLMs) مثل "لاما" من ميتا التي تضم تريليوني معلمة مذهلة، تحديًا كبيرًا. فبينما تزداد قدرات هذه النماذج غالبًا مع حجمها، تتصاعد أيضًا متطلباتها من الطاقة والوقت اللازم لتشغيلها، مما يزيد من بصمتها الكربونية. هذا الواقع يدفع الخبراء للبحث عن حلول مبتكرة تتجاوز مجرد تقليص حجم النماذج أو استخدام أرقام ذات دقة أقل، سعيًا لمسار يحافظ على الأداء العالي مع تقليل التكاليف البيئية والتشغيلية.
يبرز "الحوسبة المتفرقة" (Sparse Computing) كمسار واعد للحفاظ على الأداء العالي للنماذج الضخمة مع تقليل استهلاك الطاقة ووقت التشغيل. تعتمد هذه المقاربة على حقيقة أن معظم المعلمات – الأوزان والتنشيطات – داخل نماذج الذكاء الاصطناعي تكون صفرية أو قريبة جدًا من الصفر لدرجة يمكن التعامل معها على هذا النحو دون فقدان الدقة. هذه الخاصية، المعروفة باسم "التفرق" (Sparsity)، توفر فرصة هائلة لتوفير الموارد الحسابية: فبدلاً من إهدار الوقت والطاقة في عمليات الجمع أو الضرب بالصفر، يمكن ببساطة تخطي هذه الحسابات. علاوة على ذلك، من خلال تخزين المعلمات غير الصفرية فقط، يتم تحسين استخدام الذاكرة، مما يؤدي إلى معالجة بيانات أكثر كفاءة.
للأسف، لا تستفيد الأجهزة الشائعة اليوم، مثل وحدات المعالجة المركزية متعددة النوى (CPUs) ووحدات معالجة الرسوميات (GPUs)، بشكل كامل من خاصية التفرق بطبيعتها. لاستغلال التفرق بالكامل، يحتاج الباحثون والمهندسون إلى إعادة التفكير في كل جزء من مكدس التصميم وإعادة هيكلته، بما في ذلك الأجهزة والبرامج الثابتة منخفضة المستوى وبرامج التطبيقات. في هذا السياق، حقق فريق بحثي في جامعة ستانفورد إنجازًا رائدًا، حيث طوروا أول قطعة من الأجهزة (على حد علمهم) القادرة على حساب جميع أنواع أعباء العمل المتفرقة والتقليدية بكفاءة. أظهرت شريحتهم المخصصة أنها تستهلك في المتوسط جزءًا من سبعين من طاقة وحدة المعالجة المركزية، وأدت العمليات الحسابية أسرع بثماني مرات في المتوسط، مما يؤكد الإمكانيات الهائلة للتصميم الموجه للتفرق من الألف إلى الياء.
يمكن أن يكون التفرق موجودًا بشكل طبيعي أو يمكن إحداثه. على سبيل المثال، تكون الرسوم البيانية للشبكات الاجتماعية متفرقة بطبيعتها، حيث يمثل كل عقدة شخصًا وكل حافة صداقة. وبما أن معظم الأشخاص ليسوا أصدقاء مع بعضهم البعض، فإن المصفوفة التي تمثل جميع الحواف المحتملة ستكون معظمها أصفارًا. كما تحتوي تطبيقات الذكاء الاصطناعي الشائعة الأخرى، مثل أشكال تعلم الرسوم البيانية ونماذج التوصية، على تفرق طبيعي. علاوة على ذلك، يمكن إحداث التفرق داخل نموذج الذكاء الاصطناعي بطرق متعددة؛ فقد أظهر فريق في "سيبريبرس" (Cerebras) قبل عامين أنه يمكن تعيين ما يصل إلى 70 إلى 80 بالمائة من المعلمات في نماذج اللغة الكبيرة إلى الصفر دون فقدان أي دقة، وقد تم إثبات هذه النتائج على نموذج "لاما 7B" مفتوح المصدر من ميتا، وتمتد هذه الأفكار إلى نماذج لغة كبيرة أخرى مثل "تشات جي بي تي" و"كلود"، مما يوضح مرونة وقوة هذا المفهوم.
تنبع كفاءة الحوسبة المتفرقة من خاصيتين أساسيتين: القدرة على ضغط الأصفار بعيدًا والخصائص الرياضية الملائمة للأصفار. يمكن ضغط البيانات المتفرقة، مما يجعل تخزينها أكثر كفاءة في الذاكرة باستخدام "أنواع البيانات المتفرقة"، ويقلل بشكل كبير من البصمة الذاكرية والطاقة اللازمة لنقل مجموعات البيانات الكبيرة. على سبيل المثال، مصفوفة 4×4 بثلاثة عناصر غير صفرية فقط، والتي تشغل تقليديًا 16 مساحة في الذاكرة، يمكن ضغطها لتخزين العناصر غير الصفرية فقط مع بياناتها الوصفية (مواقع الصفوف والأعمدة)، مما يوفر مساحات كبيرة في الذاكرة. بالإضافة إلى ذلك، تصبح العمليات الرياضية مثل ضرب المتجه في مصفوفة، والتي تتطلب تقليديًا العديد من الخطوات، أسرع بكثير عن طريق تخطي العمليات التي تتضمن قيمًا صفرية، والتركيز فقط على التفاعلات غير الصفرية. يعد هذا النهج الشامل بفتح آفاق جديدة لذكاء اصطناعي أكثر كفاءة في استهلاك الطاقة وأكثر قوة.
