يُزعم أن الرئيس التنفيذي لشركة Meta Mark Zuckerberg سمح بتدريب نماذج Llama AI على المواد المحمية بحقوق الطبع والنشر

تواجه شركة Meta دعوى قضائية بشأن حقوق الطبع والنشر بسبب استخدام أعمال محمية بحقوق الطبع والنشر لتدريب نماذج الذكاء الاصطناعي (AI). تم رفع الدعوى من قبل عدة مشتكين من بينهم أيضًا العديد من المؤلفين الأكثر مبيعًا. الادعاء الأساسي ضد شركة التكنولوجيا العملاقة هو أنها استخدمت كتبًا إلكترونية ومقالات مقرصنة لتدريب الإصدارات القديمة من نماذج Llama AI الخاصة بها، مما ينتهك قوانين حقوق الطبع والنشر. بالإضافة إلى ذلك، تتهم الإيداعات أيضًا الرئيس التنفيذي للشركة مارك زوكربيرج بالسماح لفريق Llama AI الخاص به بتحميل مجمع روابط غير واضح للوصول إلى المواد المحمية بحقوق الطبع والنشر.

المعلومات تأتي من اثنين متفرق وثائق قدمت إلى المحكمة الجزئية الأمريكية للمنطقة الشمالية من كاليفورنيا يوم الأربعاء. تسلط الوثائق، المقدمة من المشتكين مثل المؤلفين سارة سيلفرمان وتا نيهيسي كوتس، الضوء على شهادة ميتا المقدمة في أواخر عام 2024 حيث تم اكتشاف أن زوكربيرج سمح باستخدام مجموعة بيانات تسمى LibGen لتدريب نماذج Llama AI الخاصة بها.

والجدير بالذكر أن LibGen (اختصار لـ Library Genesis) عبارة عن منصة لمشاركة الملفات توفر وصولاً مجانيًا إلى المحتوى الأكاديمي والمحتويات العامة. يعتبرها الكثيرون مكتبة قرصنة لأنها تتيح الوصول إلى الأعمال المحمية بحقوق الطبع والنشر والتي تكون إما متاحة خلف نظام حظر الاشتراك غير المدفوع أو غير رقمية على الإطلاق. واجهت المنصة العديد من الدعاوى القضائية وتم إصدار أمر بإغلاقها في الماضي.

تدعي التسجيلات أن Meta استخدمت مجموعة بيانات LibGen مع العلم الكامل بأنها تحتوي على محتوى مقرصن وانتهكت قوانين حقوق الطبع والنشر. واستشهدت الوثيقة أيضًا بمذكرة موجهة إلى صناع القرار في مجال الذكاء الاصطناعي في Meta والتي تنص على أنه بعد “التصعيد إلى MZ”، تمت الموافقة على فريق Meta’s AI “لاستخدام LibGen”. هنا، MZ هو اختصار لاسم الرئيس التنفيذي لشركة Meta.

بالإضافة إلى ذلك، ذكرت المذكرة أيضًا أنه تم تنبيه المديرين التنفيذيين إلى حقيقة أن المعرفة العامة حول استخدام “مجموعة بيانات نعلم أنها مقرصنة مثل LibGen” يمكن أن تقوض موقفها التفاوضي مع المنظمين. كما اتُهم عملاق وسائل التواصل الاجتماعي بتجريد معلومات حقوق الطبع والنشر من نص مجموعة البيانات والبيانات الوصفية لإخفاء انتهاكها.

وفقًا للملفات، يُزعم أن نيكولاي باشليكوف، وهو مهندس أبحاث يعمل في قسم الذكاء الاصطناعي في Meta، قام بإزالة معلومات حقوق الطبع والنشر من مجموعة بيانات LibGen. ولمزيد من إخفاء الأدلة على استخدام مجموعة البيانات المزعومة، “قام مبرمجو Meta بتضمين “عينات خاضعة للإشراف” من البيانات عند ضبط اللاما للتأكد من أن مخرجات اللاما ستتضمن إجابات أقل تجريمًا عند الإجابة على المطالبات المتعلقة بمصدر بيانات تدريب الذكاء الاصطناعي الخاصة بـ Meta”،” حسبما ذكرت الوثيقة. .

علاوة على ذلك، زعم أصحاب الشكوى أيضًا أن Meta كانت متورطة في نوع آخر من انتهاك حقوق الطبع والنشر بمجرد الوصول إلى LibGen. ادعت التسجيلات أن عملاق التكنولوجيا قام بتورنت مجموعة بيانات LibGen. تتضمن عملية استخدام Torrent كلاً من تنزيل المحتوى وتحميله (المعروف أيضًا باسم البذر). يمكن اعتبار عملية التحميل بمثابة توزيع لمواد حقوق الطبع والنشر وتشكل انتهاكًا، حسبما تزعم الإيداعات.

“لو اشترت شركة ميتا أعمال المدعين من محل لبيع الكتب أو استعارتها من إحدى المكتبات وقامت بتدريب نماذج اللاما الخاصة بها عليها دون ترخيص، لكانت قد ارتكبت انتهاكًا لحقوق الطبع والنشر. إن قرار Meta بتجاوز الطرق القانونية للحصول على الكتب وتصبح مشاركًا عارفًا في شبكة تورنت غير قانونية ينشئ CDAFA [California Comprehensive Computer Data Access and Fraud Act] “انتهاك ويعمل كدليل على انتهاك حقوق الطبع والنشر” ، ذكرت الإيداعات.

حاليًا، دعوى حقوق الطبع والنشر مفتوحة والحكم معلق. لم تقدم Meta حججها بعد، والتي من المحتمل أن تعتمد على الاستخدام العادل. سيتعين على المحكمة أن تقرر ما إذا كان من الممكن اعتبار القدرات التوليدية لنموذج الذكاء الاصطناعي تحويلية بما يكفي للتحقق من صحة هذه الحجة أم لا.

رابط المصدر