قدمت شركة علي بابا مؤخرًا نموذجًا للذكاء الاصطناعي الذي يركز على الاستدلال، والذي أطلق عليه اسم Marco-o1. يشبه هذا النموذج نموذج اللغة الكبيرة QwQ-32B، والذي تم تحسينه أيضًا للمهام التي تتطلب قدرات تفكير متقدمة، ومع ذلك، فإن أحد الفروق المهمة هو أن Marco-o1 هو نموذج أصغر ومشتق من نموذج Qwen2-7B-Instruct . ادعى عملاق التكنولوجيا الصيني أنه تم استخدام العديد من تمارين الضبط الدقيق لجعل النموذج الجديد يركز على التفكير. بالإضافة إلى ذلك، أبرز الباحثون أنه تم تحسينه لمهام حل المشكلات المعقدة في العالم الحقيقي.
نموذج علي بابا ماركو-o1 للذكاء الاصطناعي
تم تفصيل نموذج الذكاء الاصطناعي الجديد في أحد الأبحاث ورق تم نشره على arXiv، وهي مجلة إلكترونية مطبوعة مسبقًا. والجدير بالذكر أن الأوراق المنشورة في المجلة الإلكترونية لا تخضع لمراجعة النظراء. بالإضافة إلى ذلك، قامت شركة علي بابا أيضًا مستضاف نموذج الذكاء الاصطناعي على Hugging Face وقد سمح بتنزيله واستخدامه في حالات الاستخدام الشخصي والتجاري بموجب ترخيص Apache 2.0.
ومع ذلك، فهي ليست مفتوحة المصدر بالكامل حيث تم توفير مجموعة البيانات الجزئية فقط. على هذا النحو، لن يتمكن المستخدمون من تكرار النموذج أو تقسيمه لتحليل البنية أو المكونات.
عند وصوله إلى Marco-o1، تم ضبطه بدقة من نموذج الأساس Qwen2-7B-Instruct. في هذه الورقة، سلط الباحثون الضوء على أن نموذج الذكاء الاصطناعي مدعوم من خلال الضبط الدقيق لسلسلة الأفكار (CoT)، وبحث شجرة مونت كارلو (MCTS)، وآليات الانعكاس، واستراتيجيات التفكير الأخرى.
ونتيجة لهذا فإن برنامج Marco-o1 التابع لشركة علي بابا قادر على حل الأسئلة المفتوحة والعثور على استفسارات للإجابة عنها “حيثما تغيب معايير واضحة وحيث يصعب تحديد المكافآت كميا”. ومع ذلك، ينبغي أن يكون مفهوما أن قدرات التفكير المتقدمة لم تأت من أي تقدم في الأجهزة أو الهندسة المعمارية.
بدلاً من ذلك، تستخدم جميع نماذج الاستدلال اليوم تقنية تسمى حوسبة وقت الاختبار والتي تتيح لنموذج الذكاء الاصطناعي قضاء وقت معالجة أطول في استعلام واحد. وهذا يسمح لهم باختبار نظريات مختلفة للعثور على الحل والتحقق من الحقائق بأنفسهم. ونتيجة لذلك، فإن هذه النماذج موجهة نحو تقديم استجابات أكثر دقة وإكمال المهام المعقدة. أحد المجالات المهمة التي يتفوق فيها Marco-o1، وفقًا للباحثين، هو فهم الفروق الدقيقة في العامية وترجمة التعبيرات العامية.
أحد قيود نموذج الذكاء الاصطناعي، وفقًا للباحثين، ادعى أنه في حين يُظهر Marco-o1 خصائص استدلالية، فإن “أدائه لا يزال أقل من نموذج الاستدلال المُحقق بالكامل”.