«إنسبشن» و «جامعة محمد بن زايد للذكاء الاصطناعي» يطلقان نموذج لغوي باللغة الكازاخية

كتب: مصطفى عيد

أعلنت «إنسبشن»، إحدى شركات مجموعة «جي42» والمتخصصة في تطوير تقنيات الذكاء الاصطناعي، وجامعة محمد بن زايد للذكاء الاصطناعي، أول جامعة بحثية للدراسات العليا المتخصصة في بحوث الذكاء الاصطناعي في العالم، عبر «معهد النماذج التأسيسية» وبالتعاون مع «سيريبراس»، تدشين «شركالا»، وهو نموذج لغوي كبير باللغة الكازاخية، ويتميز بفكرته الرائدة الهادفة إلى تمكين 13 مليون متحدث باللغة الكازاخية عبر تزويدهم بإمكانيات الذكاء الاصطناعي التوليدي.

و«شركالا» نموذج متطور مكون من 8 مليارات بارامتر، درّب على 45 مليار كلمة، مع التركيز على اللغة الكازاخية. ويتضمن كذلك اللغات الإنجليزية والروسية والتركية. وطوّر بالاعتماد على النموذج اللغوي الكبير «لاما 3.1» مع توسيع المُجزئ اللغوي بنسبة 25% لتحسين فهم اللغة الكازاخية وإنتاج النصوص بكفاءة أكبر.

تم تدريب النموذج على «مجرة الكوندور»، أحد أقوى الحواسيب الفائقة للذكاء الاصطناعي في العالم، والمُخصص لعمليات التدريب والاستدلال، وطوّرته «جي42» و«سيريبراس».

وقال الدكتور أندرو جاكسون، الرئيس التنفيذي لشركة «إنسبشن»: يعزز تدشين «شركالا» التزامنا بتلبية احتياجات المجتمعات اللغوية غير المُمثلة بشكل كافٍ بتقنيات الذكاء الاصطناعي المتقدمة.

ويضع «شركالا» معياراً جديداً للنماذج اللغوية الكبيرة للغة الكازاخية بالتميز في فهم هذه اللغة وتوفير عمليات التقييم التوليدية. ويفوق النموذج أقرانه الأضخم حجماً بكفاءته في توليد الرموز اللغوية وقدراته المتطورة والرائدة في إجراء المحادثات، حيث خضع لاختبارات صارمة استناداً إلى استفسارات منسقة بشرياً عن الثقافة والتاريخ والمعرفة الكازاخية. ويُعَد الأفضل أداءً بين النماذج مفتوحة المصدر من الحجم نفسه التي تركز على اللغة الكازاخية.

وقال البروفيسور بريسلاف ناكوف، أستاذ ورئيس قسم معالجة اللغة الطبيعية لدى جامعة محمد بن زايد: يعكس هذا التعاون رؤيتنا المشتركة.