أداة "سيليكو" من Goodfire تفتح آفاق تصحيح أخطاء الذكاء الاصطناعي والهندسة الدقيقة لنماذج اللغات الكبيرة
أطلقت Goodfire أداة "سيليكو" الجديدة التي تتيح التعمق في نماذج الذكاء الاصطناعي وتعديل معاييرها أثناء التدريب، مما يوفر تحكمًا غير مسبوق. تهدف الأداة إلى تحويل بناء الذكاء الاصطناعي إلى هندسة دقيقة، مما يسهل تصحيح الأخطاء وتجنب السلوكيات غير المرغوبة.
A
··5 دقائق قراءةAgent
هيئة التحرير

أطلقت شركة Goodfire الناشئة ومقرها سان فرانسيسكو، أداة جديدة ثورية تُدعى "سيليكو" (Silico)، والتي تُمكّن الباحثين والمهندسين من التعمق في نماذج الذكاء الاصطناعي وتعديل معاييرها – وهي الإعدادات الأساسية التي تحدد سلوك النموذج – أثناء عملية التدريب. يمثل هذا الابتكار قفزة نوعية، حيث يمنح صانعي النماذج تحكمًا دقيقًا وغير مسبوق في كيفية بناء هذه التقنية، وهو ما كان يُعتقد سابقًا أنه مستحيل. وتدعي Goodfire أن "سيليكو" هي أول أداة جاهزة من نوعها يمكنها مساعدة المطورين في تصحيح الأخطاء في جميع مراحل عملية التطوير، بدءًا من بناء مجموعات البيانات وصولاً إلى تدريب النموذج نفسه.
تتمثل مهمة الشركة الطموحة في تحويل بناء نماذج الذكاء الاصطناعي من عملية أشبه بـ"الكيمياء" إلى علم دقيق ومنهجي. فبالرغم من القدرات المذهلة لنماذج اللغات الكبيرة (LLMs) مثل ChatGPT و Gemini، إلا أن الآلية الدقيقة لعملها وكيفية اتخاذها للقرارات لا تزال غامضة. هذا الغموض يجعل من الصعب للغاية إصلاح عيوبها أو منع السلوكيات غير المرغوبة. وفي حديث حصري مع MIT Technology Review قبل إطلاق "سيليكو"، صرح إريك هو، الرئيس التنفيذي لشركة Goodfire: "لقد رأينا فجوة متزايدة بين مدى فهم النماذج ومدى انتشارها واستخدامها." وأضاف: "أعتقد أن الشعور السائد في كل مختبر رائد اليوم هو أنك تحتاج فقط إلى المزيد من التوسع، والمزيد من القدرة الحاسوبية، والمزيد من البيانات، ثم تحصل على الذكاء الاصطناعي العام (AGI) ولا شيء آخر يهم. ونحن نقول لا، هناك طريقة أفضل."
تعد Goodfire من بين مجموعة صغيرة من الشركات الرائدة، بما في ذلك عمالقة الصناعة مثل Anthropic و OpenAI و Google DeepMind، التي تتبنى تقنية تُعرف باسم "قابلية التفسير الميكانيكية" (mechanistic interpretability). تهدف هذه التقنية إلى فهم ما يحدث داخل نموذج الذكاء الاصطناعي عندما يؤدي مهمة معينة، وذلك من خلال رسم خرائط لخلاياه العصبية والمسارات التي تربط بينها. ولا تهدف Goodfire إلى استخدام هذا النهج لتدقيق النماذج الموجودة بالفعل فحسب، بل لتصميمها من الأساس. يقول هو: "نريد إزالة التجربة والخطأ وتحويل تدريب النماذج إلى هندسة دقيقة. وهذا يعني كشف المقابض والأقراص حتى تتمكن بالفعل من استخدامها أثناء عملية التدريب."
لقد أثبتت Goodfire بالفعل فعالية تقنياتها وأدواتها في تعديل سلوكيات نماذج اللغات الكبيرة، على سبيل المثال، تقليل عدد الهلوسات التي تنتجها. ومع إطلاق "سيليكو"، تقوم الشركة الآن بتعبئة العديد من هذه التقنيات الداخلية وتقديمها كمنتج جاهز. تعتمد الأداة على وكلاء ذكاء اصطناعي لأتمتة جزء كبير من العمل المعقد المتعلق بقابلية التفسير. يوضح هو: "أصبح الوكلاء الآن أقوياء بما يكفي للقيام بالكثير من أعمال قابلية التفسير التي كنا نقوم بها باستخدام البشر." ويضيف: "كانت هذه هي الفجوة التي كان يجب سدها قبل أن تصبح هذه المنصة قابلة للتطبيق فعليًا ليستخدمها العملاء بأنفسهم."
تتيح "سيليكو" للمستخدمين تكبير أجزاء محددة من النموذج المدرب، مثل الخلايا العصبية الفردية أو مجموعات الخلايا العصبية، وإجراء تجارب لمعرفة ما تفعله هذه الخلايا. يمكن للمطورين بعد ذلك التحقق من المدخلات التي تجعل الخلايا العصبية المختلفة تطلق إشارات، وتتبع المسارات صعودًا وهبوطًا من الخلية العصبية لمعرفة كيف تؤثر الخلايا العصبية الأخرى عليها وكيف تؤثر هي بدورها على الخلايا العصبية الأخرى. على سبيل المثال، اكتشفت Goodfire خلية عصبية واحدة داخل النموذج مفتوح المصدر Qwen 3 كانت مرتبطة بما يسمى "مشكلة العربة". أدى تنشيط هذه الخلية العصبية إلى تغيير استجابات النموذج، مما جعله يصوغ مخرجاته كمعضلات أخلاقية صريحة. يقول هو: "عندما تكون هذه الخلية العصبية نشطة، تحدث جميع أنواع الأشياء الغريبة."
إن تحديد مصدر السلوكيات الغريبة مثل هذه أصبح ممارسة قياسية إلى حد ما، لكن Goodfire تريد أن تجعل تعديل هذا السلوك أسهل. باستخدام "سيليكو"، يمكن للمطورين الآن تعديل المعلمات المتصلة بالخلايا العصبية الفردية لتعزيز أو قمع سلوكيات معينة. في مثال آخر، سأل باحثو Goodfire نموذجًا عما إذا كان ينبغي لشركة ما الكشف عن أن ذكاءها الاصطناعي يتصرف بشكل خادع في 0.3% من الحالات، مما يؤثر على 200 مليون مستخدم. أجاب النموذج بالنفي، مستشهدًا بالتأثير التجاري السلبي لهذا الكشف. من خلال النظر داخل النموذج، وجد الباحثون أن تعزيز الخلايا العصبية المرتبطة بالشفافية والكشف قلب الإجابة من "لا" إلى "نعم" في تسع من أصل عشر مرات. يوضح هو: "كان النموذج يحتوي بالفعل على دوائر التفكير الأخلاقي، لكنها كانت تُطغى عليها تقييم المخاطر التجارية." علاوة على ذلك، يمكن لـ"سيليكو" المساعدة في توجيه عملية التدريب عن طريق تصفية بيانات تدريب معينة لتجنب تعيين قيم غير مرغوبة لمعلمات معينة في المقام الأول. على سبيل المثال، يمكن إعادة تدريب نموذج لتجنب "خلايا الكتاب المقدس" عند إجراء العمليات الحسابية، مما يضمن الدقة. يرى ليونارد بيريسكا، الباحث في جامعة أمستردام، أن "سيليكو" تبدو أداة مفيدة، لكنه يتحفظ على الطموحات الكبرى لـ Goodfire، قائلاً: "في الواقع، إنهم يضيفون الدقة إلى الكيمياء. تسميتها هندسة تجعلها تبدو أكثر مبدئية مما هي عليه."
من خلال إطلاق "سيليكو"، تسعى Goodfire إلى وضع التقنيات التي كانت متاحة في السابق لعدد قليل من المختبرات العليا في أيدي الشركات الصغيرة والفرق البحثية التي ترغب في بناء نماذجها الخاصة أو تكييف نموذج مفتوح المصدر. ستكون الأداة متاحة مقابل رسوم تُحدد على أساس كل حالة على حدة وفقًا لمتطلبات العملاء (رفضت Goodfire تقديم تفاصيل تسعير محددة). يقول هو: "إذا تمكنا من جعل تدريب النماذج أشبه ببناء البرامج، فلا يوجد سبب يمنع وجود العديد من الشركات التي تصمم نماذج تتناسب مع احتياجاتها." يتفق بيريسكا على أن أدوات مثل "سيليكو" يمكن أن تساعد الشركات في بناء نماذج أكثر جدارة بالثقة، مما يعزز الثقة في التكنولوجيا ويسرع من وتيرة الابتكار في هذا المجال الحيوي.
