أعلن المؤتمر العالمي (EMNLP) بنسخته التاسعة والعشرين الذي اختتمت أعماله، أمس الجمعة، في مدينة ميامي بالولايات المتحدة الأمريكية عن نشر ورقتين علميتين قدمتهما الهيئة السعودية للبيانات والذكاء الاصطناعي "سدايا" في المؤتمر العالمي الذي شارك فيه أكثر من 3500 باحث وعالِم يمثلون نخبة العلماء والمتخصصين في الذكاء الاصطناعي من مختلف دول العالم قدموا خلاله أكثر من 2300 ورقة علمية.
وقال الرئيس التنفيذي للمركز الوطني للذكاء الاصطناعي في سدايا، ياسر بن محمد العنيزان، المشارك في رئاسة اللجنة العلمية للمؤتمر إنه تم قبول ورقتين علميتين قدمتها سدايا نشرت الأولى بعنوان:(مسح منهجي ومراجعة نقدية لتقييم النماذج اللغوية الكبيرة: التحديات والقيود والتوصيات) وأكدت أن النماذج اللغوية الكبيرة (LLMs) تتميز بقدرات متعددة، لكن تقييمها الدقيق ضروري لضمان موثوقية الأداء في التطبيقات الواقعية، وتناولت الورقة تحديات التقييم وتوصيات لتحسين دقته وثباته بما يعزز من كفاءة النماذج وموثوقيتها في الاستخدام العملي.
وأفاد أن نتائج الورقة العلمية أظهرت أن الطبقات العميقة في النموذج تزيد من التوافق بين اللغات، وأن تحسين النماذج يزيد من هذا التوافق، ما يمكن النماذج من العمل بلغات لم تتدرب عليها مباشرة، وهذا يسهم مباشرة في تحسين أداء النماذج في تطبيقات مثل الترجمة الآلية والتحليل متعدد اللغات، مما يجعلها أكثر فعالية في العمل عبر لغات متعددة دون الحاجة لتدريب مخصص لكل لغة.
وأعلن ياسر العنيزان في الجلسة الختامية للمؤتمر الفائزين بجائزة أفضل ورقة علمية المقدمة من عدة فرق بحثية عالمية وهي: "الصورة تتحدث بألف كلمة، لكن هل يمكن للجميع الاستماع؟" - حول تحويل الصور لتتناسب مع السياقات الثقافية المختلفة" و"نحو تعلم تمثيل الكلام المتين لآلاف اللغات" - موجه لتحسين تعلم تمثيلات الصوت" و"عدسة خلفية: إسقاط تدرجات نموذج اللغة في فضاء المفردات" - لدراسة كيفية تأثير تدرجات النماذج اللغوية" و"كشف بيانات التدريب للنماذج اللغوية الكبيرة: طريقة معايرة قائمة على التباين" - حول أساليب معايرة الكشف عن البيانات المستخدمة في تدريب النماذج" و" CoGen: التعلم من التغذية الراجعة من خلال الفهم والتوليد المتكامل" - دراسة لتحسين التعلم من التغذية الراجعة.
ومن المقرر أن تستضيف جمهورية الصين الشعبية المؤتمر العالمي (EMNLP) خلال عام 2025 في الفترة من 5 - 9 نوفمبر في مدينة سوتشو.
وقال الرئيس التنفيذي للمركز الوطني للذكاء الاصطناعي في سدايا، ياسر بن محمد العنيزان، المشارك في رئاسة اللجنة العلمية للمؤتمر إنه تم قبول ورقتين علميتين قدمتها سدايا نشرت الأولى بعنوان:(مسح منهجي ومراجعة نقدية لتقييم النماذج اللغوية الكبيرة: التحديات والقيود والتوصيات) وأكدت أن النماذج اللغوية الكبيرة (LLMs) تتميز بقدرات متعددة، لكن تقييمها الدقيق ضروري لضمان موثوقية الأداء في التطبيقات الواقعية، وتناولت الورقة تحديات التقييم وتوصيات لتحسين دقته وثباته بما يعزز من كفاءة النماذج وموثوقيتها في الاستخدام العملي.
التوافق بين اللغات
وأشار إلى أن الورقة العلمية الثانية جاءت بعنوان ( استكشاف التوافق في المساحات المشتركة متعددة اللغات) وأوضحت أن النماذج متعددة اللغات تستطيع فهم الفروق بين اللغات بالرغم من أن السؤال يبقى حول مدى توافق هذه اللغات داخل النماذج مبينة كيفية استخدام التجميع لاكتشاف المفاهيم المشتركة وقياس التوافق والتداخل بينها باستخدام مقياسين جديدين من خلال اختبار ثلاثة نماذج مختلفة على مهام مثل: الترجمة، التعرف على الكيانات، وتحليل المشاعر.وأفاد أن نتائج الورقة العلمية أظهرت أن الطبقات العميقة في النموذج تزيد من التوافق بين اللغات، وأن تحسين النماذج يزيد من هذا التوافق، ما يمكن النماذج من العمل بلغات لم تتدرب عليها مباشرة، وهذا يسهم مباشرة في تحسين أداء النماذج في تطبيقات مثل الترجمة الآلية والتحليل متعدد اللغات، مما يجعلها أكثر فعالية في العمل عبر لغات متعددة دون الحاجة لتدريب مخصص لكل لغة.
دعم الباحثين
ولفت النظر إلى أن مشاركة سدايا في هذا المؤتمر العالمي الذي تحرص دول العالم على حضوره والمشاركة فيه يؤكد نجاح الجهود التي تعمل عليها في سبيل دعم الباحثين وتعزيز قيمة البحوث العلمية في مجال البيانات والذكاء الاصطناعي وفتح آفاقٍ واسعة لأنشطة البحث والتطوير والابتكار والمنافسة بها عالميًا للإسهام في الارتقاء بالمملكة إلى الريادة ضمن الاقتصادات القائمة على البيانات والذكاء الاصطناعي.وأعلن ياسر العنيزان في الجلسة الختامية للمؤتمر الفائزين بجائزة أفضل ورقة علمية المقدمة من عدة فرق بحثية عالمية وهي: "الصورة تتحدث بألف كلمة، لكن هل يمكن للجميع الاستماع؟" - حول تحويل الصور لتتناسب مع السياقات الثقافية المختلفة" و"نحو تعلم تمثيل الكلام المتين لآلاف اللغات" - موجه لتحسين تعلم تمثيلات الصوت" و"عدسة خلفية: إسقاط تدرجات نموذج اللغة في فضاء المفردات" - لدراسة كيفية تأثير تدرجات النماذج اللغوية" و"كشف بيانات التدريب للنماذج اللغوية الكبيرة: طريقة معايرة قائمة على التباين" - حول أساليب معايرة الكشف عن البيانات المستخدمة في تدريب النماذج" و" CoGen: التعلم من التغذية الراجعة من خلال الفهم والتوليد المتكامل" - دراسة لتحسين التعلم من التغذية الراجعة.
ومن المقرر أن تستضيف جمهورية الصين الشعبية المؤتمر العالمي (EMNLP) خلال عام 2025 في الفترة من 5 - 9 نوفمبر في مدينة سوتشو.