في أبريل ، قال الرئيس التنفيذي لشركة Microsoft أن الذكاء الاصطناعي كتب الآن بالقرب من ثلث رمز الشركة. في أكتوبر الماضي ، وضع الرئيس التنفيذي لشركة Google رقمها في حوالي ربع. لا يمكن أن تكون شركات التكنولوجيا الأخرى بعيدة. وفي الوقت نفسه ، تنشئ هذه الشركات منظمة العفو الدولية التي من المفترض أن تستخدم لمساعدة المبرمجين بشكل أكبر.
لطالما كان الباحثون يأملون في إغلاق الحلقة بالكامل ، مما يخلق عوامل الترميز التي تعمل على تحسين أنفسهم بشكل متكرر. يكشف بحث جديد عن عرض مثير للإعجاب لمثل هذا النظام. الاستقراء ، قد يرى المرء نعمة للإنتاجية ، أو مستقبل أكثر قتامة للبشرية.
وقال يورغن شميدهوبر ، عالم الكمبيوتر في جامعة كينغ عبد الله للعلوم والتكنولوجيا (KAUST) ، في المملكة العربية السعودية ، التي لم تشارك في البحث الجديد: “إنه عمل جميل”. “أعتقد بالنسبة لكثير من الناس ، النتائج مفاجئة. بما أنني كنت أعمل على هذا الموضوع منذ ما يقرب من 40 عامًا ، فقد يكون الأمر أقل إثارة للدهشة بالنسبة لي.” لكن عمله خلال ذلك الوقت كان محدودًا من قبل التكنولوجيا في متناول اليد. أحد التطورات الجديدة هو توفر نماذج اللغة الكبيرة (LLMS) ، وهي محركات تعمل على تشغيل chatbots مثل ChatGPT.
في الثمانينيات والتسعينيات من القرن الماضي ، استكشف Schmidhuber وغيرهم خوارزميات تطورية لتحسين وكلاء الترميز ، وإنشاء برامج تكتب البرامج. تأخذ الخوارزمية التطورية شيئًا (مثل البرنامج) ، وإنشاء اختلافات ، ويحتفظ بأفضلها ، ويتكرر على هؤلاء.
لكن التطور لا يمكن التنبؤ به. التعديلات لا تعمل دائمًا على تحسين الأداء. لذلك في عام 2003 ، ابتكر Schmidhuber حل المشكلات الذين يعيدون كتابة التعليمات البرمجية الخاصة بهم فقط إذا كان بإمكانهم إثبات أن التحديثات مفيدة رسميًا. ووصفهم آلات Gödel ، التي سميت باسم Kurt Gödel ، عالم الرياضيات قام بعمل في أنظمة المرجع الذاتي. ولكن بالنسبة للعوامل المعقدة ، لا تأتي الأداة المساعدة بسهولة. قد تضطر الأدلة التجريبية إلى يكفي.
قيمة الاستكشاف المفتوح
تعتمد الأنظمة الجديدة ، الموصوفة في مجموعة preprint الأخيرة على Arxiv ، على مثل هذه الأدلة. في إشارة إلى Schmidhuber ، يطلق عليهم Machines Darwin Gödel (DGMS). يبدأ DGM بعامل الترميز الذي يمكنه قراءة الكود والكتابة وتنفيذ ، والاستفادة من LLM للقراءة والكتابة. ثم يطبق خوارزمية تطورية لإنشاء العديد من الوكلاء الجدد. في كل تكرار ، يختار DGM وكيلًا واحدًا من السكان ويوجه LLM لإنشاء تغيير واحد لتحسين قدرة ترميز الوكيل. LLMs لديها شيء مثل الحدس حول ما قد يساعد ، لأنها تدرب على الكثير من الكود البشري. ما هي النتائج هي التطور الموجه ، في مكان ما بين طفرة عشوائية وتعزيز مفيد بشكل كبير. يقوم DGM بعد ذلك باختبار الوكيل الجديد على معيار الترميز ، حيث سجل قدرته على حل تحديات البرمجة.
تحتفظ بعض الخوارزميات التطورية بأفضل أداء فقط في السكان ، على افتراض أن التقدم يتحرك إلى الأمام إلى ما لا نهاية. ومع ذلك ، فإن DGMS تبقيهم جميعًا ، في حالة وجود ابتكار فشل في البداية في الواقع يحمل مفتاح الاختراق اللاحق عند تعديله. إنه شكل من أشكال “الاستكشاف المفتوح” ، وليس إغلاق أي مسارات للتقدم. (DGMs تقوم بإعطاء أولويات هدافين أعلى عند اختيار السلف.)
قام الباحثون بتشغيل DGM لـ 80 تكرارًا باستخدام معيار ترميز يسمى SWE-BENCH ، وركضوا واحدًا مقابل 80 تكرارًا باستخدام معيار يسمى Polyglot. تحسنت درجات الوكلاء على مقعد SWE من 20 في المائة إلى 50 في المائة ، وعلى Polyglot من 14 في المائة إلى 31 في المائة. وقالت جيني تشانغ ، عالمة الكمبيوتر بجامعة كولومبيا البريطانية والمؤلفة الرئيسية للصحيفة: “لقد فوجئنا حقًا حقًا أن وكيل الترميز يمكن أن يكتب مثل هذا الشفرة المعقدة في حد ذاته”. “يمكنه تحرير ملفات متعددة ، وإنشاء ملفات جديدة ، وإنشاء أنظمة معقدة حقًا.”
قام وكيل الترميز الأول (المرقم 0) بإنشاء جيل من عوامل الترميز الجديدة والمختلفة قليلاً ، تم اختيار بعضها لإنشاء إصدارات جديدة من أنفسهم. يشار إلى أداء الوكلاء من خلال اللون داخل الدوائر ، ويتم تمييز أفضل وكيل أداء مع نجم. جيني تشانغ ، شينجران هو ، وآخرون.
من الأهمية بمكان أن DGMS تفوقت على طريقة بديلة استخدمت نظامًا خارجيًا ثابتًا لتحسين العوامل. مع DGMS ، تضاعفت تحسينات الوكلاء أثناء تحسينهم لتحسين أنفسهم. تفوقت DGMS أيضًا على نسخة لم تحافظ على مجموعة من الوكلاء وقامت فقط بتعديل أحدث وكيل. لتوضيح الاستفادة من النظرة المفتوحة ، أنشأ الباحثون شجرة عائلة من عوامل Swe-Bench. إذا نظرت إلى أفضل وكيل الأداء وتتبع تطوره من البداية إلى النهاية ، فقد أجرى تغييرين قللوا من الأداء مؤقتًا. لذلك اتبع النسب مسار غير مباشر للنجاح. الأفكار السيئة يمكن أن تصبح جيدة.
يعرض الخط الأسود على هذا الرسم البياني الدرجات التي حصلت عليها الوكلاء داخل نسب العامل الأفضل أداءً. يتضمن الخط اثنين من الانخفاضات في الأداء. جيني تشانغ ، شينجران هو ، وآخرون.
لم يكن أفضل وكيل SWE-Bench جيدًا مثل أفضل وكيل صممه البشر الخبراء ، والذي يسجل حاليًا حوالي 70 في المائة ، ولكن تم إنشاؤه تلقائيًا ، وربما مع ما يكفي من الوقت والحساب ، يمكن أن يتطور العامل إلى ما وراء الخبرة البشرية. وقال Zhengyao Jiang ، أحد مؤسسي Weco AI ، وهي منصة تتم أتمتة تحسين الكود ، إن الدراسة هي “خطوة كبيرة إلى الأمام” كدليل على مفهوم التحسين الذاتي العودية. وقال جيانغ ، الذي لم يشارك في الدراسة ، إن النهج يمكن أن يحقق المزيد من التقدم إذا عدل LLM الأساسي ، أو حتى بنية الرقائق. (تصمم Alphaevolve من Google Deepmind خوارزميات ورقائق أساسية أفضل ووجدت طريقة لتسريع تدريب LLM الأساسي بنسبة 1 في المائة.)
يمكن لـ DGMS من الناحية النظرية أن يسجل الوكلاء في وقت واحد على معايير الترميز وأيضًا تطبيقات محددة ، مثل تصميم الأدوية ، لذلك سيتحسنون في تصميم الأدوية. قالت تشانغ إنها ترغب في الجمع بين DGM مع Alphaevolve.
هل يمكن أن تقلل DGMS من توظيف المبرمجين للمبتدئين؟ يرى جيانغ تهديدًا أكبر من مساعدي الترميز اليومية مثل المؤشر. وقال: “البحث التطوري يتعلق حقًا ببناء برامج عالية الأداء حقًا تتجاوز الخبير البشري” ، كما فعل Alphaevolve في مهام معينة.
مخاطر التحسين الذاتي العودية
أحد القلقات مع كل من البحث التطوري وأنظمة التفمين الذاتي-وخاصة مزيجها ، كما هو الحال في DGM-هو السلامة. قد يصبح الوكلاء غير قابل للتفسير أو غير محسوس مع التوجيهات البشرية. لذلك أضاف تشانغ ومتعاونوها الدرابزين. لقد احتفظوا DGMs في صناديق الرمل دون الوصول إلى الإنترنت أو نظام التشغيل ، وقاموا بتسجيل ومراجعة جميع تغييرات التعليمات البرمجية. يقترحون أنه في المستقبل ، يمكن أن يكافئوا منظمة العفو الدولية على جعل نفسها أكثر قابلية للتفسير والمحاذاة. (في الدراسة ، وجدوا أن الوكلاء أبلغوا زوراً عن استخدام أدوات معينة ، لذلك قاموا بإنشاء DGM الذي يكافئ الوكلاء لعدم تصنيع الأمور ، ويخففون من المشكلة جزئيًا. ومع ذلك ، قام عميل واحد باختراق الطريقة التي تتبع ما إذا كانت تصنع الأمور.)
في عام 2017 ، التقى الخبراء في Asilomar ، كاليفورنيا ، لمناقشة الذكاء الاصطناعى المفيدة ، ووقع العديد منهم على خطاب مفتوح يسمى مبادئ Asilomar AI. في جزء منه ، دعا إلى قيود على “أنظمة الذكاء الاصطناعى المصممة لتصوير ذاتي بشكل متكرر”. إحدى النتائج المتخيلة في كثير من الأحيان هي ما يسمى التفرد ، حيث تتجاوز AIS ذاتيا خارج سيطرتنا وتهديد الحضارة الإنسانية. أخبرني شميدهوبر: “لم أوقع ذلك لأن الخبز والزبدة التي كنت أعمل عليها”. منذ سبعينيات القرن الماضي ، توقع أن يأتي الذكاء الاصطناعى الخارق في الوقت المناسب له للتقاعد ، لكنه يرى أن التفرد هو نوع من عسر الولادة في الخيال العلمي الذي يحب الناس الخوف. جيانغ ، وبالمثل ، ليس قلقًا ، على الأقل في الوقت الحالي. لا يزال يضع قسطًا على الإبداع الإنساني.
ما إذا كان التطور الرقمي يهزم التطور البيولوجي للاستيلاء. ما هو لا جدال هو أن التطور في أي ستار له مفاجآت في المتجر.
من مقالات موقعك
المقالات ذات الصلة حول الويب