اليوم: د. نورهان عباس

كشفت شركة ميتا، المشغلة لموقع التواصل الاجتماعي الأبرز، فيسبوك، عن نموذج مبتكر للذكاء الاصطناعي يسمى فويس بوكس Voicebox لديه القدرة على إحداث ثورة في توليد الكلام والمحادثات.

وفي إحدى المدونات، أعلنت ميتا، عن أن فويس بوكس هو النموذج الأول القادر على التعميم على مهام إنشاء نصوص كلامية بأداء استثنائي، حتى بدون تدريب محدد لهذه المهام، وفق ما ذكر موقع إنديا تي في.

بخلاف النماذج التقليدية التي تنشئ صورًا أو نصًا، يتخصص فويس بوكس، في إنتاج مقاطع صوتية عالية الجودة.

يمكن أن يولد الكلام في أنماط متعددة، إما من البداية أو عن طريق تعديل العينات المقدمة.

ويدعم النموذج إنشاء نصوص كلامية بست لغات هي: الإنجليزية والفرنسية والألمانية والإسبانية والبولندية والبرتغالية.

بالإضافة إلى ذلك، يوفر فويس بوكس ميزات مثل محو الضوضاء وتحرير المحتوى وتحويل النمط الكلامي وتوليد عينات متنوعة.

وحول ما يميز فويس بوكس، فهو منهج التعلم الفريد، حيث يتعلم فويس بوكس، مباشرة من البيانات الصوتية الأولية والنسخ المصاحبة.

ويتيح ذلك للنموذج تعديل أي جزء من عينة معينة، وليس النهاية فقط، ما يعزز المرونة والتنوع. إضافة إلى كل ذلك، فإن فويس بوكس تم تدريبه على التنبؤ فيما يخص طرح نسخ كلامية.

بمجرد أن يتمكن النموذج من القدرة على الكلام بناءً على سياق معين، يمكن تطبيقه على مجموعة واسعة من الأمثلة، فهذا سيسمح له بتسجيل أجزاء صوتية محددة دون إعادة إنتاج التسجيل بالكامل.

وبفضل تعدد استخداماته، يتفوق فويس بوكس على العديد من التطبيقات الأخرى المشابهة، بما في ذلك توليف النص إلى كلام في سياق مين، ونقل النمط الكلامب للغات أخرى، وتحرير الكلام، وأخذ عينات كلامية متنوعة.

يوفر أداء النموذج وقدرته على التكيف إمكانيات جديدة لتوليد أصوات إبداعية، بل وإمكانية التلاعب بالكلام.

وسبق أن أطلقت شركة ميتا، تطبيق معتمد على الذكاء الاصطناعي، وهو ميوزك جين، وظيفته العمل على توليد الموسيقى.

وعلق موقع مارك تيك بوست، بقوله، أن فويس بوكس، يمثل تقدمًا كبيرًا في مجال توليد الكلام، حيث يقدم نموذجًا قويًا للذكاء الاصطناعي قادرًا على إنتاج مقاطع صوتية عالية الجودة وأداء مهام مختلفة متعلقة بالكلام بنتائج استثنائية.