نشرت شركة OpenAI دراسة حول نموذج ذكاء اصطناعي جديد يوم الخميس يمكنه اكتشاف أخطاء GPT-4 في إنشاء التعليمات البرمجية. وذكرت شركة الذكاء الاصطناعي أن روبوت المحادثة الجديد تم تدريبه باستخدام إطار التعلم المعزز من ردود الفعل البشرية (RLHF) وكان مدعومًا بأحد نماذج GPT-4. تم تصميم روبوت المحادثة قيد التطوير لتحسين جودة التعليمات البرمجية التي تم إنشاؤها بواسطة الذكاء الاصطناعي والتي يحصل عليها المستخدمون من نماذج اللغة الكبيرة. في الوقت الحاضر، النموذج غير متاح للمستخدمين أو المختبرين. كما سلطت شركة OpenAI الضوء على العديد من القيود المفروضة على النموذج.
OpenAI تشارك تفاصيل حول CriticGPT
شاركت شركة الذكاء الاصطناعي تفاصيل نموذج CriticGPT الجديد في مشاركة مدونةصرحت شركة CriticGPT أن هذا النموذج يعتمد على GPT-4 ومصمم لتحديد الأخطاء في الكود الذي تم إنشاؤه بواسطة ChatGPT. “لقد وجدنا أنه عندما يحصل الأشخاص على مساعدة من CriticGPT لمراجعة كود ChatGPT فإنهم يتفوقون على أولئك الذين لا يحصلون على مساعدة بنسبة 60 بالمائة من الوقت”، كما تدعي الشركة. تم تطوير النموذج باستخدام إطار عمل RLHF وتم نشر النتائج في مجلة RLHF. ورق.
RLHF هي تقنية تعلُّم آلي تجمع بين مخرجات الآلة والبشر لتدريب أنظمة الذكاء الاصطناعي. في مثل هذا النظام، يقدم المُقيِّمون البشريون ملاحظات حول أداء الذكاء الاصطناعي. ويُستخدم هذا لتعديل سلوك النموذج وتحسينه. ويُطلق على البشر الذين يقدمون الملاحظات للذكاء الاصطناعي اسم مدربي الذكاء الاصطناعي.
تم تدريب CriticGPT على حجم كبير من بيانات التعليمات البرمجية التي تحتوي على أخطاء. تم تكليف نموذج الذكاء الاصطناعي بالعثور على هذه الأخطاء ونقد التعليمات البرمجية. لهذا، طُلب من مدربي الذكاء الاصطناعي كتابة الأخطاء في التعليمات البرمجية فوق الأخطاء التي تحدث بشكل طبيعي، ثم كتابة ملاحظات نموذجية كما لو أنهم اكتشفوا هذه الأخطاء.
بمجرد مشاركة CriticGPT لنسخها المتعددة من انتقاداتها، طُلب من المدربين تحديد ما إذا كانت الأخطاء التي أدخلوها قد تم اكتشافها بواسطة الذكاء الاصطناعي إلى جانب الأخطاء التي تحدث بشكل طبيعي. وجدت OpenAI في بحثها أن CriticGPT كان أداؤه أفضل بنسبة 63 بالمائة من ChatGPT في اكتشاف الأخطاء.
ومع ذلك، لا يزال النموذج يعاني من بعض القيود. فقد تم تدريب CriticGPT على سلاسل قصيرة من التعليمات البرمجية التي تم إنشاؤها بواسطة OpenAI. ولم يتم تدريب النموذج بعد على مجموعات طويلة ومعقدة من المهام. كما وجدت شركة الذكاء الاصطناعي أن برنامج الدردشة الجديد لا يزال يعاني من الهلوسة (إنتاج استجابات واقعية غير صحيحة). علاوة على ذلك، لم يتم اختبار النموذج في السيناريوهات التي تنتشر فيها أخطاء متعددة في التعليمات البرمجية.
من غير المرجح أن يتم نشر هذا النموذج للعامة لأنه مصمم لمساعدة OpenAI على فهم تقنيات التدريب التي يمكنها توليد مخرجات ذات جودة أعلى بشكل أفضل. إذا تم نشر CriticGPT للعامة، فمن المعتقد أنه سيتم دمجه داخل ChatGPT.
للحصول على أحدث الأخبار والمراجعات التقنية، تابع Gadgets 360 على إكس, فيسبوك, واتساب, الخيوط و أخبار جوجلللحصول على أحدث مقاطع الفيديو حول الأدوات والتقنيات، اشترك في قناتنا قناة يوتيوبإذا كنت تريد معرفة كل شيء عن كبار المؤثرين، فاتبع موقعنا الإلكتروني من هو360 على انستجرام و موقع YouTube.
بوليفيا تلغي حظر البيتكوين وتشرع المعاملات المشفرة للبنوك