شاهد هذا الموضوع -ميتا تكشف عن نموذج الذكاء الاصطناعي الجديد Spirit LM لتحسين التجارب الصوتية- عبر موقع فري بوست والآن الى تفاصيل الموضوع
أعلنت شركة ميتا عن إطلاق نموذج الذكاء الاصطناعي الجديد “Spirit LM” المفتوح المصدر، والذي يهدف إلى تطوير معالجة الصوت بشكل أكثر تقدمًا وطبيعية. يركز هذا النموذج على التغلب على التحديات المتعلقة بالنماذج المتعددة الوسائط، مع التركيز على تحسين جودة الأصوات وتقديم تجربة صوتية أكثر تعبيرًا وواقعية.
نموذج “Spirit LM” يعتمد على نموذج لغوي مدرب مسبقًا يحتوي على 7 مليارات معلمة، ويأتي بتقنية جديدة تختلف عن النماذج التقليدية التي تعتمد على تقنيات التعرف التلقائي على الكلام (ASR). ميتا أشارت إلى أن تلك التقنيات التقليدية تفتقر إلى القدرة على نقل التعبيرات الطبيعية في الصوت بشكل دقيق، مما يقلل من واقعية التفاعل الصوتي.
لتجاوز هذه التحديات، يعتمد “Spirit LM” على رموز الفونيم والنغمات ودرجات الصوت، ما يمنحه القدرة على توليد أصوات طبيعية. كما يُمكّن النموذج من التعلم المستمر لأداء مجموعة متنوعة من المهام مثل التعرف على الكلام، وتحويل النص إلى صوت، وتصنيف الكلام بطريقة متقدمة.
وقد كشفت ميتا عن هذا النموذج من خلال ورقة بحثية مفصلة تضمنت عينات صوتية توضح قدرات “Spirit LM” وتطبيقاته المحتملة. يتوقع أن يُستخدم هذا النموذج في المستقبل داخل التطبيقات المملوكة لميتا مثل واتساب وانستقرام وفيسبوك، مما يتيح للمستخدمين تجربة تفاعل صوتي أكثر تعقيدًا وطبيعية.
“Spirit LM” متاح الآن كمشروع مفتوح المصدر، مما يسمح للمطورين والباحثين بالاستفادة من إمكانياته وتطويره، وهو يعد خطوة مهمة نحو تحسين تجارب الذكاء الاصطناعي الصوتية، التي أصبحت ضرورية في التواصل الحديث.
وقد وصلنا إلى نهاية المقال ، و تَجْدَرُ الإشارة بأن الموضوع الأصلي قد تم نشره ومتواجد على موقع النجم للأخبار التقنية وقد قام فريق التحرير في موقع فري بوست بالتأكد منه وربما تم التعديل عليه وربما قد يكون تم نقله بالكامل أو الإقتباس منه ويمكنك قراءة ومتابعة مستجدات هذا الخبر أو الموضوع من مصدره الأساسي ولا يتحمل فري بوست أية مسؤولية قانونية عن الصور أو الخبر المنشور شاكرين لكم متابعتكم.
رابط الخبر الأصلي