قدمت Meta Platforms يوم الأربعاء أداة AI مفتوحة المصدر تسمى AudioCraft والتي ستساعد المستخدمين على إنشاء الموسيقى والصوت بناءً على مطالبات النص.
تم تجميع أداة الذكاء الاصطناعي مع ثلاثة طرز ، AudioGen و EnCodec و MusicGen ، وتعمل مع الموسيقى والصوت والضغط والتوليد ، Meta قال.
وأضافت أن MusicGen يتم تدريبه باستخدام موسيقى مملوكة للشركة ومرخصة بشكل خاص.
أثار الفنانون وخبراء الصناعة مخاوف بشأن انتهاكات حقوق النشر ، حيث تعمل برامج التعلم الآلي من خلال التعرف على الأنماط وتكرارها من البيانات المأخوذة من الويب.
وفقًا لمدونة الشركة ، تقوم MusicGen بإنشاء الموسيقى من المطالبات النصية ، بينما تقوم AudioGen بإنشاء الصوت من المطالبات النصية. أصدرت Meta أيضًا نسخة محسّنة من وحدة فك ترميز EnCodec الخاصة بنا. يساعد في توليد موسيقى عالية الجودة مع عدد أقل من القطع الأثرية. تتيح نماذج AudioGen المدربة مسبقًا ، والتي أعلنت عنها الشركة ، للمستخدمين إصدار أصوات بيئية وتأثيرات صوتية ، فهي تساعد في توليد أصوات مثل لحاء الكلب أو صفارات الإنذار من المركبات.
ستكون النماذج متاحة للوصول للباحثين والممارسين لتدريب نماذجهم باستخدام مجموعات البيانات الخاصة بهم. تدعي الشركة أن هذه النماذج قادرة على إنتاج صوت عالي الجودة مع تناسق طويل الأمد. لقد تم تطويرها داخليًا في Meta على مدار السنوات الماضية.
قالت الشركة إن نماذج AudioCraft ستعمل كأدوات للموسيقيين ومصممي الصوت في المستقبل. تعمل الشركة أيضًا على تحسين النماذج الحالية وإضافة الارتجالات بناءً على ملاحظات المستخدمين.
في وقت سابق من هذا العام ، قدمت Alphabet أداة الذكاء الاصطناعي التجريبية الخاصة بها لتوليد الصوت والتي تسمى MusicLM.