كتب: عبد الله طه
أرسل إلى صديق
المعلومات التي تقدمها على هذه الصفحة لن تُستخدم لإرسال بريد إلكتروني غير مرغوب فيه، ولن تُباع لطرف ثالث. طالع سياسة الخصوصية.
في مضمار تطوير نماذج الذكاء الاصطناعي، تتنافس الشركات الكبرى على استقطاب أفضل المواهب وجذب الاستثمارات وتوجيه الموارد الهائلة لتحقيق مكاسب مستقبلية.
وفق مؤشر الذكاء الاصطناعي الصادر من جامعة ستانفورد، شهد عام 2023 إطلاق 61 نموذجًا بارزًا للذكاء الاصطناعي من مؤسسات مقرها الولايات المتحدة الأمريكية، متفوقةً بفارق كبير على الاتحاد الأوروبي الذي أنتج 21 نموذجًا، والصين التي أنتجت 15 نموذجًا فقط.
في خضم هذا السباق المحتدم، لاحت محاولات عربية، خاصةً فيما يتصل بالنماذج اللغوية الكبيرة، ففي مايو 2023، أطلقت أبو ظبي نموذج ’فالكون40 ب‘ مفتوح المصدر، وفي يوليو تلاه إطلاق نموذج ’جيس‘ كي يدعم العربية، في مارس 2024، أطلق مطورون سعوديون ’مُلهم‘، وهو نموذج لغوي دُرب على مجموعة بيانات سعودية حصريًّا.
وانضمت قطر إلى هذا السباق بإطلاق نموذجها اللغوي ’فنار‘، الذي طوره معهد قطر لبحوث الحوسبة في جامعة حمد بن خليفة، بدعم من وزارة الاتصالات وتكنولوجيا المعلومات القطرية، وأعلن عنه خلال القمة العالمية للذكاء الاصطناعي، التي انعقدت في العاصمة السعودية الرياض من 10 إلى 12 ديسمبر 2024.
النموذج متخصص في فهم اللغتين العربية والإنجليزية ومعالجتهما، والقصد من ورائه تقديم محتوى يعكس القيم والثقافة المحلية.
في مقابلة لشبكة SciDev.Net وكريم درويش، من فريق تصميم ’فنار‘، وهو باحث أول في معهد قطر لبحوث الحوسبة، تحدث عن خصائص النموذج، وعن زملاء تطويره، ودوافعهم، وأهدافه.
ما هو ’فنار‘؟ وكيف يعمل؟
يُعد ’فنار‘ نموذجًا لغويًّا كبيرًا على غرار ’شات جي بي تي‘، يعتمد على تحليل كميات هائلة من النصوص، ما يمكّنه من توقُّع الكلمات والجمل الراجح ظهورها في سياق معين.
على سبيل المثال، إذا كتبت: ”ذهب الولد ليدرس في …“، فإن النموذج يستنتج أن الكلمة التالية هي ’المدرسة‘ بناءً على احتمالية ظهورها في هذا السياق، ويعتمد عمل هذه النماذج ومدى فاعليتها على قدرتها على التعلم من الأنماط اللغوية الموجودة في النصوص التي دُرِّبت عليها، فكلما زادت كمية البيانات تحسنت دقة توقعاته.
يمكن تشبيه الأمر بتعلُّم الإنسان اللغة من خلال قراءة الكتب والاستماع إلى المحادثات.
مَن يدرب فنار؟ وكيف طور؟
مهمة تطوير ’فنار‘ اضطلع بها فريق مكون من حوالي 30 باحثًا ومهندسًا بالمعهد، مستفيدين من خبرة تزيد على 15 عامًا في مجال حوسبة اللغة العربية.
جمع الفريق كميةً هائلةً من البيانات النصية العربية والإنجليزية لتدريب النموذج، وبلغ حجم نصوص البيانات العربية نحو نصف تريليون كلمة، جُمعت من مصادر متنوعة تشمل الإنترنت، لا سيما مواقع الويب، ومكتبات رقمية، بالإضافة إلى شراكات مع جهات مثل وزارة الأوقاف.
دُرِّب النموذج على نصف تريليون كلمة إنجليزية، ما يمكِّن ’فنار‘ من التعامل مع اللغتين بعمق وفاعلية وبدقة عالية.
ما الدوافع وراء تطوير ’فنار‘؟ وهل طُور من الصفر أم استند إلى نماذج موجودة؟
هذا سؤال ممتاز، أحد أهم الدوافع كان توطين التقنية؛ فمن الضروري أن يكون للدول العربية والإسلامية القدرة على تطوير وتدريب نماذج لغوية كبيرة خاصة بها، تعزز هويتنا الثقافية واستقلاليتنا التكنولوجية وتحمينا من التأثيرات الثقافية الخارجية.
مع وجود 300 مليون مستخدم نشط شهريًّا لمنصة ’شات جي بي تي‘، يمكن أن تؤثر هذه المنصات على تشكيل وعي المستخدمين والمنطلقات وما المقبول وغير المقبول، ووجود جهة خارجية لها هذا التأثير على مواطني المنطقة العربية أمرٌ شديد الخطورة، لذا من المهم أن يكون لدينا نماذج لغوية منافسة تحافظ على ثقافتنا وهويتنا.
سأضرب مثالين، الأول، عند طرح سؤال حول المساكنة قبل الزواج، قد يرد ’شات جي بي تي‘ برد محايد يُظهر تنوع الثقافات وأهمية القبول بين الطرفين وأن بيدهما القرار، أما ’فنار‘ فسيقدم إجابة واضحة تعكس القيم الإسلامية مؤكدًا أهمية العفة في القيم الإسلامية وأن المساكنة قبل الزواج محرمة، ما يزيل اللبس تمامًا.
مثال آخر، القضية الفلسطينية معقدة عند ’شات جي بي تي‘ ويتجنب الخوض فيها، أما ’فنار‘ فيؤكد حق الفلسطينيين في تقرير مصيرهم وإقامة دولتهم، ورفض الظلم والاحتلال.
وأما التطوير، فقد طُور فنار باستخدام نموذجين، الأول طُوِّر من الصفر، ودُرِّب على بيانات خام بحجم 7 مليارات مُحدد، والنموذج الثاني استند إلى نموذج Gemma 2 بحجم 9 مليارات محدد، وأُعيد تدريبه ليكتسب طابعًا خاصًّا من البيانات الثقافية المحلية.
ما التحديات التي واجهتموها في أثناء تطوير النموذج؟
أكبر التحديات التي واجهتنا كانت محدودية المحتوى العربي عالي الجودة على الإنترنت مقارنةً بالمحتوى الإنجليزي الذي تتوافر له تريليونات الكلمات وتبلغ 10 تريليونات وأحيانًا 20 تريليون كلمة وأكثر، بينما لا يتجاوز المحتوى العربي المتاح 200 – 300 مليار كلمة، إضافةً إلى أن النصوص العربية غالبًا ما تكون أضعف من حيث دقة المعلومات والأسلوب العلمي.
كي يتضح الأمر، أضرب لك مثالًا بسيطًا، بمقارنة موسوعة ويكيبيديا العربية والإنجليزية، ستجد حجم ويكيبيديا الإنجليزية أضعاف حجم العربية ومقالاتها أطول وجودتها أفضل، البيانات العربية المتوافرة لا تتجاوز نسبة 1% من حجم البيانات المتاحة عامة.
ليس أمرًا محمودًا أن تكون بياناتنا بتلك الندرة.
إضافةً إلى ذلك، كان التحدي الأكبر هو تمثيل التنوع اللغوي في العالم العربي، بما يشمل العربية الفصحى القديمة والفصحى الحديثة، واللهجات المختلفة مثل المصرية والخليجية والعراقية والشامية والمغاربية، وغالبًا ما تتوافر هذه البيانات بقوة في مواقع التواصل الاجتماعي وهو مصدر أقل جودة مقارنة بمصادر مثل ويكيبيديا، فضلًا عن صعوبة جمعها.
كيف يمكن وصف أداء نموذج فنار مقارنةً بالنماذج العربية الأخرى؟
سؤال طيب، أُجري تقييم جودة مخرجات ’فنار‘ مقارنة بنماذج عربية وإقليمية مثل ’جيس‘ و’مُلهم‘، وأخرى عالمية مثل ’شات جي بي تي‘ و’جيميني‘، وأظهرت النتائج أن ’فنار‘ يتمتع بجودة عالية وأداء متميز في اللغة العربية، متفوقًا في بعض الاختبارات على النماذج الأخرى.
كما تم تقييم ’فنار‘ بناءً على مجموعة متنوعة من المهمات مثل تلخيص النصوص، ووضع العناوين، والإجابة عن الأسئلة المعلوماتية، وتحليل النصوص اللغوية مثل إعراب النصوص وتشكيلها، وحل المسائل الرياضية.
هذا التقييم المتعدد يمنح صورة أكثر شمولية؛ لأن التقييم الأحادي غير عادل عادةً، ويهدف التقييم إلى معرفة مواطن القصور، بحيث يتم تحديث النموذج باستمرار لتحسين أدائه وتطوير قدراته بشكل دوري.
ما هي استخدامات نموذج فنار؟ وهل هو متاح بشكل تجاري أم مفتوح المصدر؟
حاليًّا، النموذج موجود ومتاح مجانًا على الموقع الخاص به، ويمكن لأي شخص استخدامه بسهولة.
أما بالنسبة لتوفيره مفتوح المصدر، فإن هذا الأمر لا يزال قيد التداول، كما ذكرت، لدينا أكثر من نموذج، وقد يكون أحدها مفتوح المصدر والآخر لا.
رؤيتنا أن الاستخدام الأكبر للنموذج سيكون في المجال التجاري، مثل تقديم خدمات للعملاء من خلال تطبيقات تعتمد على النموذج اللغوي الكبير للعمل في الخلفية، مما يساعد في تحسين تجربة المستخدم، حاليًّا، نحن في مرحلة دراسة النموذج التجاري المناسب لتلبية احتياجات المستخدمين.
كم عدد المستخدمين للنموذج؟
عدد المستخدمين للنموذج بالآلاف الآن.
ما الإستراتيجيات المتبعة لتحسين التدريب في ظل الموارد المتاحة؟ وما هي المجالات المحتملة لمزيد من التحسين مستقبلًا؟
تطوير النماذج اللغوية الكبيرة يعتمد على متطلبات حاسوبية هائلة، إذ يختلف حجم هذه المتطلبات وفق حجم النموذج، على سبيل المثال، هناك نماذج تبدأ بمليار محدد وأخرى تحتوي على مئات المليارات من المعلمات مثل Llama 3 أو GPT-4.
لتدريب نموذج لغوي يحتوي على 7 مليارات معلمة من الصفر باستخدام تريليون كلمة، نستخدم أكثر من 220 بطاقة H100 GPU ، وهي واحدة من أكثر بطاقات الحاسوب تطورًا في العالم إن لم تكن الأقوى.
مرور البيانات عبر هذه البطاقات مرة واحدة يستغرق حوالي 10 أيام إلى أسبوعين، وكي ندرب نموذجًا مثل ’فنار‘، فقد استمر العمل على هذه البطاقات -دون توقف- لأكثر من شهر، أما لو كان هدفنا تدريب نموذج بمئات المحددات كالنماذج العالمية، فلك أن تتخيل حجم الموارد الحاسوبية والوقت اللازم لذلك.
نظرًا للموارد المحدودة، طورنا نموذجين أصغر حجمًا (7 مليارات و9 مليارات معلمة) لضمان فاعلية التدريب، كما عملنا على تحسين جودة البيانات وتقليص حجمها عن طريق انتقاء أفضل البيانات في المراحل الأخيرة من التدريب.
بالإضافة إلى ذلك، أجرينا ضبطًا إحصائيًّا باستخدام ملايين الأمثلة من الأسئلة والإجابات لتحسين تفاعل النموذج مع استفسارات المستخدمين، يمكنني القول إننا وظفنا مواردنا على نحو جيد للوصول إلى أفضل أداء بموارد محدودة.
كم تبلغ الفاتورة البيئية لتشغيل نموذج فنار من المياه والطاقة اللازمين لتشغيل الخوادم المسؤولة عن تدريبه؟ وهل يمكن لدولنا العربية تحمُّل تلك الفاتورة مقارنةً بالفوائد؟
ليس عندي إجابة عن هذا السؤال فهو خارج نطاق تخصصي، لذا لا يمكنني تقديم رقم دقيق لهذه التكلفة، ربما يستطيع أعضاء آخرون من الفريق تقديم معلومات أدق في هذا الصدد، ولكن استخدام بطاقات GPU بكثافة يتطلب استهلاكًا كبيرًا للطاقة، يُتوقع أن يكون لهذه العمليات أثر بيئي، وهو ما يستدعي دراسةً أعمق من المتخصصين.
هذا الموضوع أنتج عبر المكتب الإقليمي لموقع SciDev.Net بإقليم الشرق الأوسط وشمال أفريقيا