معهد الابتكار التكنولوجي في أبوظبي يطلق تحدّياً جديداً في مجال الذكاء الاصطناعي حول أساليب تصنيف البيانات الضخمة
كتب:رامي سميح
أعلن معهد الابتكار التكنولوجي، ذراع الأبحاث التطبيقية التابع لمجلس أبحاث التكنولوجيا المتطورة في أبوظبي، عن إطلاق تحدي CrowdLabel: جمع آراء المستخدمين حول النماذج اللغوية الكبيرة، وهي مبادرة تهدف إلى تطوير أساليب مبتكرة جديدة تتيح للمستخدمين عنونة وتصنيف البيانات بشكل تلقائي.
الجدير بالذكر أنّ النماذج اللغوية الكبيرة تستخدم التعلم المعزّز بالاعتماد على المُدخلات البشرية من أجل تحقيق التوافق مع تفضيلات الأفراد، غير أنّ الاستعانة بفِرَق من المقيّمين قد تترتّب عليها تكاليف مرتفعة.
ومن هنا تأتي أهمية هذا التحدّي الذي يهدف إلى تطوير نهج يسمح بتصنيف عيّنات البيانات دون شعور واعٍ من المستخدمين بأنهم يؤدّون مهمة التصنيف والعنونة، من خلال دمج عملية عنونة البيانات في مهمة أو عملية أخرى يقومون بها، وتساهم أساليب التوافق هذه في خفض التكاليف بفضل تضمينها في مهام أخرى مثل كواشف البرمجيات الآلية (Bot Detectors).
وقد أنشأ معهد الابتكار التكنولوجي قاعدة بيانات تضم عينات موجّهة لهذا الاستخدام، بحيث توفر للخبراء والباحثين في مجال النماذج اللغوية الكبيرة مُدخلات واسعة وموثوقة لتحسين نماذجهم.
وفي إطار هذا التحدّي، يبحث المعهد عن آليات جديدة لتقديم هذه المجموعات إلى جمهور متنوع وواسع بهدف عنونة مئات الآلاف من عيّنات البيانات بكلفة منخفضة وعلى نطاق واسع.
وسيتّسم الحل المقترح بفعاليته وقدرته على التنافس إذا برهن قدرته على معالجة لغات متعددة، مع ضرورة أن يكون ملائماً للتطبيق في لغتين على الأقل، بالإضافة إلى إمكانيته للتعامل مع محتوى متعدّد الوسائط يشتمل على أنواع مختلفة من التصنيفات وفي مجالات متنوعة.
وسيتم تقييم المشاركات بناءً على مستوى ابتكار الفكرة وفعاليتها من حيث التكلفة وحجم وجودة العناوين التي يتم جمعها من الجمهور أثناء الإطلاق التجريبي.
ويُرحِّب المعهد بالمشاركات الفردية والجماعية من جميع أنحاء العالم، سواء كانت من شركات ناشئة أو معاهد بحثية أو طلاب جامعيين، لاقتراح وتطوير تقنيات تتيح للمستخدمين عنونة البيانات بسلاسة، ودون إدراكهم التام لكونهم يقومون بمهمة العنونة.
تجدر الإشارة إلى أن إجمالي الجوائز المتاحة في التحدّي يبلغ 50,000 دولار بما في ذلك جائزة قدرها 30,000 دولار للفائز بالمركز الأول.
علماً بأن الموعد النهائي لاستلام المشاركات في تحدّي “تطوير الأساليب المبتكرة لعنونة البيانات البشرية لتوافق النماذج اللغوية الكبيرة” هو 28 فبراير 2025.