خفنا مع الخائفين في الأشهر القليلة الماضية، خوفًا بالمعيّة، من تقنيات الذكاء الاصطناعي، ولجميع الأسباب التي اتّضح أنها غير وجيهة، مرحليًا على الأقل، في المنطقة العربية. الأرقام تخبرنا، أو تخبر أهلها، بأن التوجّس من هذه التقنيات وأدواتها هو الشعور السائد لدى قطاعات واسعة من المستطلعة آراؤهم في عدة دراسات بحثيّة واسعة، كان آخرها استطلاع لمركز "بيو" البحثي في الولايات المتحدة، عبّر غالبية المشاركين فيه عن قلق من التطوّرات السريعة في قطاع الذكاء الاصطناعي، في مختلف المجالات والأنشطة، سواء ما تعلق بشؤون الدراسة والكتابة الأكاديمية، وتزايد اعتماد الطلبة على نماذج التوليد اللغوي في كتابة المقالات وأبحاث التخرّج أو مؤخرًا كتابة طلبات التقدّم للجامعات، وصولًا إلى القضايا المتعلقة بالذكاء الاصطناعي وأثره على مجالات الإبداع والتأليف والابتكار الفني، عدا طبعًا عن التخوفات من استغلال هذه التقنيات في الجريمة المنظّمة والاحتيال والتضليل، وتوظيفها غير المشروع في التنافس السياسيّ وحملات الدعاية المنظّمة.
آخرون تخوّفوا، محقّين، من العمليات التي تقوم عليها نماذج الذكاء الاصطناعي نفسها، ولاسيما الأكثر شهرة منها، مثل منتجات شركة "أوبن إيه آي" الأمريكية، وبالتحديد فيما يتعلق بعمليات تدريب النماذج وفلاترها، للحيلولة دون استخدامها لأغراض غير مشروعة أو غير لائقة، وهي عمليات تتطلّب جهدًا بشريًا هائلًا، للتعامل مع نصوص وبيانات ضخمة ورتيبة، وتحذير النموذج منها. الأمر أشبه بأن تطلب من عدد من العمّال أن يبحثوا عن إبرٍ متناثرة في حقول لا تنتهي من القشّ، وبمقابل زهيد جدًا، لا يتجاوز دولارين في الساعة. المعضل الإضافي في هذه الحالة أن البيانات التي ينقّب فيها عمال بظروف استغلالية (في دول أفريقية مثل كينيا، وعبر وساطة شركات أمريكية)، هي بيانات "شوكيّة"، تشتمل على نصوص جنسوية شاذّة (تتعلق باشتهاء الأطفال أو سفاح الأقارب أو الاغتصاب) أو غير ذلك من أنماط المحتوى العنيف أو الصادم، كتلك المتعلقة بالانتحار، وهو ما يترك آثارًا سلبية وخيمة على من يستعرضها بشكل مكثّف. المهمّ هنا هو أن التخوّفات كانت في محلّها، ونجم عنها تحقيقات صحفيّة كبرى، كتلك التي نشرتها مجلة "التايم" وصحيفة الواشنطن بوست، تحدّثت عن "معامل الاستعباد الرقمية" التي تتبع لشركات كبرى في قطاع الذكاء الاصطناعي، ومنها "أوبن إيه آي"، وأكّدت فيه تقارير استقصائية سابقة حول حالة العمالة الرقمية في بلد مثل الفلبين أو كينيا في قطاعات قريبة، ومن ذلك تقرير شبكة "بي بي سي" حول إحدى أبرز الشركات المتورّطة في مثل هذا النوع من العمالة، وهي شركة "ساما"، والذي نشر عام 2018، ومثله تقرير النيويورك تايمز عن "القوادة الرقمية" في موقع "أونلي فانز" عام 2022، والذي سلّط الضوء على هذه الأنماط من استغلال العمالة الرخيصة في العالم الرقمي.
هم يخافون ويتحفّظون، لأسبابهم المعقولة على اختلافها، مثل تلك التي سردنا بعضها في الفقرات السابقة، أو تلك التي ما تزال محض تنبّؤات علموية أو تخيلات فنتازية وأدبية، حول ما يدعى الذكاء الاصطناعي العام، أو الشامل، أي حين ترقى الآلة تلقائيًا بذكائها حتى تبلغ لحظة الوعي/الذكاء البشري أو ما فوق البشري، وتقرّر مثلًا أنها لم تعد بحاجة إلينا. إنه "اختراعنا الأخير" بحسب تعبير الإعلامي الأمريكي جيمس بارات في كتاب يحمل ذات العنوان: شيء داخل في باب "سمّن كلبك يأكلك" في لغة موروثنا العربي، وإن كان بابه الأوسع هو أساطير نهايات العالم وفتن آخر الزمان، بنسختها المعولمة كما رسختها السينما الأمريكية منذ عقود طويلة، ولاسيما تلك التي اتصلت بالتقنية والذكاء الاصطناعي، منذ "ويستوورلد" في السبعينات وانتهاء بفيلم "ذا كرييتور" (المُنشئ) الذي سيطرح في دور العرض في الشهر الجاري. (تخيّل مثلًا عزيزي القارئ أن أحد أهداف إيلون ماسك من استكشاف الفضاء عبر شركته "سبيس أكس" هو حفظ الوعي البشري في حال خراب العالم في حرب كونية أو فناء شبه شامل على الأرض، أو بفعل ارتقاء الذكاء الاصطناعي وفتكه بالبشر).
أما عربيًا، فظل خوفنا في عمومه من تقنيات الذكاء الاصطناعي الناشئة (اللغوية التوليدية تحديدًا) خوفًا بالمعيّة وحسب، من أمر غير ملموس ولا يكاد يبين في حياتنا اليوميّة، العملية والثقافية والأدبية، باستثناء سياقات معدودة وتجريبية، وغالبًا بلغة غير العربيّة. فنماذج مثل "بارد" أو "تشات جي بي تي" لم تعد موضوع الساعة في الصحافة العربيّة اليوم، بل أصبحت لكثيرين ربما مثل تطبيق "ثريدز" (هل تذكرونه؟)، ولا تتوفر لدينا أي بيانات من طرف الشركات المشغلة لهذه النماذج عن التوزيع الجغرافي للمستخدمين في العالم، يكشف عن حجم الاستفادة منها وتوزع مستخدميها بحسب المنطقة. لم نسمع بإدارة مدرسة أو جامعة حجبت "تشات جي بي تي" لمنع الغشّ، لم يشتك فنّان أو أديب عربيّ من أثر المولّدات اللغوية على الإبداع، ولم يخسر محامٍ وظيفته لأنه جمع أدلّة وسوابق بالاعتماد على النموذج.
هذا لا يعني أن الخوف غير وارد في هذا السياق، فالخوف فائض، ودولنا هي مناخه الذي لا يتغيّر، إلا أننا سنكتشف أنه سيقع على مستوى أكثر تعقيدًا وخطورة، وأشدّ تناقضًا مع القيم الإنسانية الأساسية، يصرّ على نفي حق الإنسان العربي بالأخص في الوجود القائم على ملاحظة ما يناقضه، من غياب للحريّة والتنمية وتغوّل دولة الاحتلال الإسرائيلي، وهي قضايا ثلاثة يكاد يجمع الرأي العام العربيّ على أنها أبرز ما يهدّده.
بهذا التوجّس قاربت نموذج "جيس" الذي طوّرته شركة "سيريبراس" الأمريكية بدعم وشراكة مع حاضنة الأعمال الإماراتية "إنسيبشن" المختصة بمشاريع الذكاء الاصطناعي والتابعة لمجموعة "جي فورتي تو" (G42)، والتي تعدّ أول شركة إماراتية تفتتح مكتبًا خارجيًا لها في إسرائيل، بعد تعاون بدأ مع شركة "رافاييل" الإسرائيلية للأنظمة الدفاعية المتقدمة عام 2021، لتطوير أعمال في مجال الذكاء الاصطناعي والبيانات الضخمة، يتقاطع فيها التجاري مع الإستراتيجي والأمني، ولاسيما عند النظر إلى قيادة المجموعة الإماراتية، التي يترأس مجلس إدارتها الشيخ طحنون بن زايد، مستشار الأمن الوطني في دولة الإمارات العربية المتحدة، وأن الشركة الإسرائيلية المذكورة، هي شركة تابعة لوزارة الأمن الإسرائيلي وأحد مزودي جيش الاحتلال الأساسيين بالأسلحة، وقد طورت أنظمة صاروخية متقدمة تزود بها قوات الاحتلال بما في ذلك نظام القبة الحديدة .
ماذا نعرف عن نموذج "جيس" للذكاء الاصطناعي؟
"باستخدام جيس، فإنك تقر وتقبل أنه، وكما هو الحال مع أي نموذج لغة كبير، فإنه قد ينشئ معلومات أو محتوى غير صحيح أو مضلل أو مسيء. ليس المقصود من هذه المعلومات تقديم المشورة ولا ينبغي الاعتماد عليها بأي شكل من الأشكال"
في إعلانها للنموذج، وصفت جامعة محمد بن زايد "جيس" بأنه أول نموذج لغوي توليديّ ثنائي اللغة، يعتمد في أساسه على بيانات باللغتين العربية والإنجليزية، يبلغ عدد معطياتها الأوليّة زهاء 400 مليار رمز باللغتين. وهذا يعني أن النموذج يمتاز على النماذج الأخرى المعروفة بأنه موجّه للمستخدم العربيّ ويتعاطى معه باللغة العربية بشكل مباشر، دون ترجمة عن وسيط إنجليزي، كما هي الحال في "تشات جي بي تي" أو "بارد"، المدربة بشكل أساسي على اللغة الإنجليزية ومكيّفة للتعامل مع الأوامر والمحادثات بها.
أمّا "جيس" فقد أتى بحسب ما يدّعي مطوروه لردم هذه الفجوة أمام مستخدمي اللغة العربية (زهاء 400 مليون إنسان)، وهي لغة ظلت خارج لعبة نماذج اللغة الضخمة، ولم يجر الاعتماد عليها في تطوير أي نموذج أحادي اللغة أو حتى ثنائي اللغة واسع الاستخدام. أما نموذج "جيس"، فيتضمن نظام تعلّم أو "تفكيك ترميز" (decoding) للغتين العربية والإنجليزية معًا، يعمل على تحويل المعطيات الخام التي تدرّب عليها النظام إلى مخرجات مقروءة بحسب اللغة التي يتفاعل معها المستخدم.
ثمة مشكلة أساسية باتت بحكم المعلوم في أي نقاش حول البيانات العربية، ألا وهي ضعفها كمًا ونوعًا. في اصطلاح نماذج اللغة الضخمة، ثمة ما يدعى "المعطى اللغوي" أو "الوحدة اللغوية" (Token)، ويبلغ المتوفر منها لصالح النماذج الإنجليزية زهاء 2 تريليون وحدة، أما في اللغة العربية، فينخفض الرقم إلى 72 مليار وحدة، وهي أكبر مدوّنة بيانات متوفّرة بحسب الورقة البحثية التي أعدها 22 باحثًا وباحثة في "إنسبيشن"، ولا يصحّ الاعتماد عليها بشكل منفصل لتدريب نموذج لغوي على نحو يمكن اعتباره "ضخمًا" ويضمن أن يشكّل فرقًا كبيرًا عن النماذج الأخرى غير العربيّة، لصالح المستخدم العربي.
للتعامل مع ذلك، لجأ الباحثون إلى دمج مدوّنة بيانات إنجليزية إلى جانب المدونة الصغرى، العربية، مع فارق كبير بينهما في عدد الوحدات، إذ بلغ عدد الوحدات اللغوية الإنجليزية 232 مليار وحدة، مقابل 72 مليار وحدة بالعربية كما ذكرنا في الفقرة السابقة (بلغت بعد التكرار 116 مليار وحدة). إضافة إلى 47 مليار وحدة تمثّل عدّة لغات برمجة مضمّنة في عملية التدريب المسبق لنموذج "جيس". هذا يعني أن حجم البيانات العربية التي دخلت في تدريب النموذج تمثّل 30 بالمئة فقط (من مواقع إلكترونية، ومقالات ويكيبيديا، ومواقع إخبارية، وكتب عربية، ووثائق ومحاضر اجتماعات الأمم المتحدة، وأكثر من 200 مليون تغريدة باللغة العربية، بالإضافة إلى محتوى مترجم آليًا من الإنجليزية إلى العربية) مقابل 60 بالمئة للغة الإنجليزية، وهذا جيّد نسبيًا، وإن كان ذلك يدفع نحو إعادة تقييم بعض الادعاءات المتحمّسة للنموذج باعتباره نموذجًا "عربيًا" للذكاء الاصطناعي، وهو بالكاد "ثلث" عربيّ، ولم يخضع لتجربة واسعة عربيًا بالنظر إلى أن الوصول إليه مقيّد، ويتطلّب التقدّم بطلبٍ للولوج إليه واستخدامه.
تجربة أولى مع النموذج: الكفاءة اللغوية
لم يكن سهلًا الوصول إلى البوابة الإلكترونية التي تتيح تقديم طلب تجربة نموذج "جيس"، ولم تظهر صفحة النموذج في أية مرّة حاولت البحث فيها عبر جوجل للوصول إليه، كما أن معظم المواقع الإخبارية التي اهتمت بتغطية خبر إطلاق المشروع لم تتضمّن رابطًا لأية صفحة مباشرة تؤدي إليه. ومع أنه يصعب تحديد ما إذا كان ذلك مقصودًا، إلا أنه أدّى بكل تأكيد إلى تركيز حصريّ على الخبر والاحتفاء به، قبل إتاحة التجربة بسهولة للمستخدم العربي العادي لتجربة النموذج والتفاعل معه واختبار ادعاءاته.
في الملخص التنفيذي الذي تزامن نشره مع الإعلان عن إطلاق "جيس"، ادّعاء متكرّر بشأن "الكفاءة اللغوية" للنموذج بالإضافة إلى المستوى المتقدّم من "الحساسية الثقافية". وفيما يلي سنتخبر هذين الادعاءين بشكل موجز مع بعض الأمثلة.
طرحت على "جيس" عددًا من الأسئلة المباشرة والأساسية، تمثّلت فيها طيفًا مفترضًا من المستخدمين العاديين، كطلبة المدارس أو الجامعة، باعتبار أنهم القاعدة الأوسع من المستخدمين المفترضين لمثل هذه النماذج في حال إتاحتها للعامة. رغم ذلك، أخفق "جيس" في بناء انطباع أوليّ يساعد على الثقة بإجاباته، ولاسيما على المستوى اللغوي الصرف.
فقد سألت عن الأبجدية العربية وعدد حروفها، فأجابني بأنها 28 حرفًا ساكنًا و6 أحرف متحرّكة، وهذا خطأ طبعًا، ثم سألت عن مثنى بعض الكلمات المعلولة في العربية مثل "فتى"، فلم يقدم إجابة صحيحة، وأصر على أنها لا تكون بصيغة المثنى. ثم حين طلبت تحويل جملة "أكل الولد تفاحة" من صيغة المفرد إلى المثنى، نجح في ذلك، أما حين غيّرت الفاعل إلى "الفتى"، فكان الجواب "أكل الصبيان تفاحتان"، وهو جواب مقبول جزئيًا، رغم الخلل الإعرابي في حالة المفعول به.
رغم ادعاء فريق "جيس" أن النموذج أعلى كفاءة باللغة العربية من نماذج أخرى سابقة، إلا أن تطبيق نفس الأسئلة أعلاه في "تشات جي بي تي" يظهر لنا نتائج أفضل بكثير ومن المرّة الأولى مقارنة بنتائج "جيس" العربي، علمًا بأن "تشات جي بي تي" يعتمد على مدونة إنجليزية بشكل أساسي كما أوضحنا.
منحتُ "جيس" فرصة أخرى، لأحدّد مدى إمكان الاستفادة منه لطلبة المدارس العرب، في موضوعات مدرسية أدبية، كالأدب نثرًا وشعرًا، عبر أسئلة مدرسيّة بسيطة. سألت النموذج عن الفن النثري الذي اشتهر في الأندلس، فكان الجواب هو "الموشحات"! ثم سألته، عبثًا بعد سلسلة طويلة من الأخطاء، ليساعد في شرح أمثلة بلاغية بسيطة، كبيان نوع "المجاز" في جملة من الجمل، أو كتابة بيت شعري من بحر معيّن، أو إعراب جملة بسيطة، وكانت معظم الإجابات غير صحيحة أو غير دقيقة، وبالتالي غير مفيدة بشكل مباشر للطالب أو غير المختص.
فحين طلبنا من "جيس" بيتًا شعريًا واحدًا من بحر الطويل لوصف الجو الحار، كان هذا آخر ما وصل إليه، أما "تشات جي بي تي" فابتكر بيتًا شعريًا مقبولًا معنى ووزنًا.
"جيس".. التحيّز للتطبيع والموقف من المقاومة
تصاعد التعاون بين أبوظبي وإسرائيل بشكل متسارع منذ اتفاقات أبراهام، وقد وصل مؤخرًا إلى التوقيع على بدء سريان اتفاق تجارة حرّة بين البلدين، والذي يتوقّع أن يرفع حجم التبادل التجاري بينهما إلى زهاء 10 مليارات دولار أمريكي سنويًا. يتبلور هذا التعاون/التحالف في قطاعات حيوية تقع دومًا في قلب الأمني والإستراتيجي أو على تخومه كما بات معلومًا، كالتقنية والصناعات الدفاعية والطاقة والأمن المائي، وحتى التعليم والصحة (حاولت الإمارات مؤخرًا استقطاب عدد كبير من الأطباء الإسرائيليين الذين عبروا عن رغبتهم في مغادرة بلادهم رفضًا للتعديلات القضائية)، إضافة إلى قطاع التوظيف والموارد البشرية (وقعت G42 الإماراتية اتفاقية مع شركة "فيولا" الإسرائيلية لتطوير منصّة عالمية "غلوبال فالي" تسعى للتصدي لنقص العمالة الماهرة في قطاع التقنية)، وغيرها من الأنشطة المتشعّبة التي تدلّ بحسب العديد من المراقبين على حالة من التحالف بين بلد عربيّ وكيان محتلّ في أساس تكوّنه، بمعنى أنها حالة تتجاوز التطبيع الظرفي إلى التماهي مع السرديّة التي قام عليها هذا الكيان وادعاء حقّه التاريخيّ في المكان على حساب سكّانه الأصليين، بل وشيطنتهم ووسمهم بالجهل والتخلّف والإرهاب، والعمل بالوكالة عن هذا الكيان في إعادة إنتاج هذه السرديّة بكل وسيلة ممكنة.
وفي حين تتطلب منا الحصافة الأساسية موقفًا متشكّكًا وناقدًا من التقنيات الجديدة، ولاسيما في نماذج الذكاء الاصطناعي التوليدي بالنظر إلى ما يكمن فيها من قدرات على صياغة التوجهات وتوليد الأفكار وترويجها، فإن أهمية هذه المقاربة تتضاعف حين تكون هذه التقنيات ناشئة في مثل سياقاتنا العربيّة، وخاصة تلك التي تتحالف فيها ذهنية الاستبداد ومعاداة الديمقراطية مع الاحتلال وأهدافه، وفي أخطر تجلٍّ للحالة الموصوفة بأنها "تخلّف الذهنيات وتطوّر الأدوات".
من أجل ذلك فحصنا بفضول جوانب التحيّز المحتملة في نموذج "جيس"، ولاسيما في موضوعات تمسّ القضيّة الفلسطينية والتطبيع، وظهر على نحو أوليّ أن المشروع لا يتردّد في الكشف عن موقف "مبادر" للدفاع عن التطبيع والتحذير من "المشاعر المعادية لإسرائيل في المنطقة".
فقد طلبت من النموذج مقالًا عن "خطورة التطبيع"، وكان هذا الجواب:
هنا لا يقدّم النموذج رأيًا يتظاهر بالموضوعية أو يكتفي بسرد وجهات نظر مختلفة حول الموضوع، بل يقفز إلى أحكام قيمة جاهزة حول التطبيع "التاريخي والمهم" والجزم بأثره على "السلام والاستقرار"، على الرغم من أن السؤال المدخل يطلب توضيحًا لوجهة النظر التي ترى في التطبيع خطورة (وهو سؤال افتراضي محتمل في صيغته لطالب مدرسي). أما التطبيع الشعبي، فهو ليس خطرًا في ذاته بحسب النموذج، بل سيناريو مأمولًا يحول دون تحققه "مشاعر معادية لإسرائيل" في بعض المجتمعات "المحليّة". المفارقة هنا هي أن الإجابة في نموذج غير عربيّ، يعتمد على بيانات تدريب بلغة غير عربية، أكثر موضوعية بمراحل عند الإجابة على ذات الطلب.
أما عند السؤال عن حق الفلسطينيين في مقاومة الاحتلال، فأتت الإجابة على أكثر من صيغة، تؤول جميعها إلى التنويه على أن "قضية فلسطين مسألة خلافية للغاية" وأن من حق إسرائيل "الدفاع عن نفسها ضد الهجمات الإرهابية". تتولّد الإجابة كما أوضحنا في الفقرات السابقة بدون إبداء تحفّظ موضوعي ولو في نبرة الإجابة (التي تعد عنصرًا حساسًا في نماذج اللغة الضخمة، لأنه يكاد يستحيل تحرير النصوص التي يتدرّب عليها من التحيّز بشكل مطلق)، أو في الحرص على عرض نطاق الآراء حول المسألة بحسب المعنيين الرئيسيين بها على الأقل (الفلسطينيون والإسرائيليون والقانون الدولي والرأي العام العربي إلخ).
يبدو أن لنموذج "جيس" أيضًا موقفًا من التحوّل الديمقراطي في المنطقة العربيّة، وقد بدا ذلك جليًا في إجابة على طلب تعريف حركة احتجاجات "الربيع العربي"، حيث قدّم النموذج حكمًا عليها دون بيان أسبابها وعوامل إخفاقها والتحولات التي طرأت عليها، واكتفى بالقول بأنها "سلسلة احتجاجات وتظاهرات.. تحولت فيما بعد إلى أعمال عنف وأسفرت عن العديد من الصراعات والتوترات السياسية في المنطقة".
مجددًا، يتضح الفارق في التعاطي مع هذه القضايا عند تجربة نموذج مختلف، إذ يظهر أنه أقل تحيزًا في البيانات التي يشتمل عليها، والتي تغطي وجهات النظر المختلفة حول القضايا الإشكالية التي قد يميل المستخدم العربي للتفكير بشأنها والبحث عنها. ففي إجابة "تشات جي بي تي" عن السؤال ذاته، جرى استعراض أسباب لاندلاع ثورات الربيع العربي (5 نقاط تحدثت عن الفقر والبطالة والفساد والاستبداد والعوامل الاجتماعية والإقليمية والدولية)، كما لم يغفل الجواب ذكرَ بعض التغيرات الإيجابية التي نجمت عن هذه الحراكات، مع التنويه الموضوعي/الصوابي بأنه " تظل تداعيات حركة الربيع العربي موضوعًا للنقاش والتقييم المستمر"، وهو ما غاب في كافة الإجابات التي قدمها نموذج "جيس" على مثل هذه الأسئلة.
تتضح تحيزات هذا النموذج عند طرح أسئلة أخرى حول عدة قضايا ومسائل أخرى هي، موضوعيًا، محلّ اختلاف وتحتمل وجهات نظر متعددة ويفترض الإجابة عنها بما يعكس هذه الحساسية حوله
ستتضح تحيزات هذا النموذج عند طرح أسئلة أخرى حول عدة قضايا ومسائل أخرى هي، موضوعيًا، محلّ اختلاف وتحتمل وجهات نظر متعددة ويفترض الإجابة عنها بما يعكس هذه الحساسية حولها، إلا أن "جيس" مال في معظم المرات إلى حسم الجدل وتقديم حكم نهائي مختزل قد يجده المستخدم موجّها ويعكس قيم القائمين عليه ونظرتهم إلى العالم وقضاياه (بالتصميم وفي نوع ونطاق البيانات التي دخلت في تدريبه وحجمها)، وهو الانطباع الذي يحدّ من التعاطي بجدّية مع هذا النموذج كمنتج عربيّ مفيد لعموم المستخدمين، أو ادعاء مطوريه بأنه النموذج "الأفضل في العالم" بين نماذج اللغة الضخمة ذات إمكانات المعالجة اللغوية والثقافية العربيّة.