GPT بالعربي: هل يحاكي الذكاء الاصطناعي شعرًا عبّاسيًا؟
حسين محس
ذكاء اصطناعي
ديريك أبيلا، صحيفة النيويورك تايمز
منتصف الستينيات صمّم جوزيف وايزنباوم أحد أوّل النماذج الآلية المتحدّثة (chatbots)، وعبّر بعد عشر سنوات عن دهشته لما قد تستطيع نماذج إلكترونية بسيطة خلقه من أفكار وهميّة لدى بعض المستخدمين والمستخدمات. عند إطلاقه النموذج في معهد ماساشوستس للتكنولوجيا (MIT)، سمى وايزنباوم النموذج بـ«إليزا» وأعلن عن محدوديّة ما باستطاعته القيام به: كان باستطاعة النموذج طرح أسئلة محدودة فقط، واستُعمل للعب دور المعالج النفسي الذي يطرح، على نسق مدرسة كارل رودجرز في علم النفس، أسئلةً تتفاعل مع ما يقوله من يلجأ للحديث معه وتخوله أن يقود الحديث.
في تشرين الثاني 2022، أعلنت شركة «أوبن للذكاء الاصطناعي» OpenAI عن نموذجها المتحدّث الآلي الجديد «شات جي بي تي» (ChatGPT)، صاحب القدرات غير المسبوقة، والذي احتوى عددًا هائلًا من العوامل المتغيّرة، أو الخصائص، التي تعلّمها النموذج أثناء التدريب. بعد أقل من أسبوعين، أعلن المدير التنفيذي للشركة، سام ألتمان، أن النموذج «محدودٌ للغاية» وحذّر من الاعتماد عليه للحصول على المعلومات. لم تقتصر إجابات «شات جي بي تي» على علم النفس، بل تعدّتها لانتاج نصوصٍ وأجزاء من برمجيات، أو حتى تقليد أساليب كاتبات وكتاب.
بين «إليزا» و«شات جي بي تي»، لم يتضاعف حجم الدهشة وأعداد المستخدمين فقط، إنما حجم النموذج أيضًا. تدرب GPT-3، النموذج المؤسس لـ «شات جي بي تي» والذي أعلن عنه في أيار 2020، على أكثر من 550 غيغا بايت من البيانات النصيّة التي جمع معظمها من الإنترنت. احتاج النموذج لتقدير 175 مليار عامل متغير (parameter) خلال فترة التدريب، ولاتباع أفكار مبتكرة أغنت عملية التدريب.
كيف تعمل نماذج GPT؟
تشبه العوامل المتغيّرة للنماذج الخوارزميّة خصائص آلة معيّنة يتم تعديلها باستمرار حتى تصبح الأخيرة فعّالة وقادرة على القيام بما هو متوقع منها. خلال تدريب نماذج الذكاء الاصطناعي مثل GPT-3، تحمل كل من هذه العوامل المتغيّرة عددًا رقميًا. لتعلّم الأنماط الإحصائية داخل البيانات، وتقدير العلاقات بين الكلمات والجمل المختلفة فيها، ويتبدل المحتوى الرقمي للعوامل المتغيرة باستمرار حتى تصبِحَ معًا قادرة على توقع الكلمات التالية في جملة ما.
تعمل الكتابة الآلية كبناءٍ تدريجيٍ تحكمه الأنماط الإحصائية التي تعلمها النموذج من البيانات النصيّة التي تدرّب عليها. إن اقتصرت البيانات على كتابات فرجينيا وولف مثلًا، سينحاز النموذج للعبارات التي استعملتها وولف بشكل واضح، وستتشابه جمله، جزئيًا، مع أسلوب الكاتبة. لكن بيانات تدريب GPT-3 لم تقتصر على نصوص كاتبة معينة ولا حتى على أعمال أدبيّة، وهو ما يفسر قدرته على التحدث بمواضيع مختلفة. لعبت ضخامة البيانات، بالإضافة إلى قدرات OpenAI المادية، دورًا أساسيًا في رسم قدرات النموذج، لكن تفوّقه والموجة التقنية التي ينتمي إليها في عالم الإنتاج الآلي للنصوص يرتكز على فكرة خوارزميّة حديثة نسبيًا تدعى «آليات الانتباه» (attention mechanisms).
ركزت خوارزميات إنتاج النصوص التي سبقت GPT-3 والنماذج المماثلة له على السياقات الضيّقة في الجُمَل. لتقدير دور كلمةٍ ما مثلًا، كان باستطاعة الخوارزميات النظر في محيطها الضيق لمحاولة ربطها بالكلمات القليلة المحيطة بها. خلال التدريب، كانت الخوارزميات تسير بالتتابع داخل الجمل وتحاول، خطوةً خطوة، تقدير علاقات الكلمات في سياقاتها المحدودة فقط. استطاعت نماذج تأسست على تلك الخوارزميات تحقيق نتائج لا بأس بها، لكنها بقيت مقيّدة بتلك السياقات الضيقة للكلمات وببطء التدريب شديد التسلسل أثناء تحليل البيانات.
عام 2017 قدّمت مجموعة بحثية من جامعة تورنتو وغوغل فكرة جديدة تقضي بتعميم «آليات الانتباه» الخوارزمية لتقدير العلاقات بين الكلمات بالتوازي وضمن سياقات واسعة جدًا. لم تكن آليات الانتباه جديدة، لكن استخدامها على نطاق واسع في النصوص حرّر عمليات التدريب من الحاجة إلى التسلسل أثناء تقدير العلاقات البينية في النص، ووسع قدرة الخوارزميات على ربط كلمات متباعدة عن بعضها. بمعنى آخر، بات للخوارزميات عيون واسعة المدى وسريعة الملاحظة ضمن حدود النصوص تستطيع عبرها التقدير الفعال للتراكيب المعقدة في لغة ما. مع هذه الأفكار الخوارزمية، وتوفر البيانات النصية الضخمة كما التقنيات المادية (hardware) الغزيرة التي تستطيع OpenAI تأمينها، كانت GPT-3.
هيمنت اللغة الإنكليزية على نماذج إنتاج النصوص لتركّز إنتاجها نسبيًا في الولايات المتحدة، لكنّ الخوارزميات المشغّلة لهذه النماذج تستطيع تقدير قواعد لغةٍ ما بنفسها أثناء تفكيك البيانات النصية المعطاة لها. مكنت هذه القدرة، بعد توفر الموارد والتخطيط، من إنتاج نماذج لأكثر من 40 لغة دون تغييرات بنيوية على عملية التدريب. لا يزال صعود هذه النماذج الضخمة في بداياته، لكنها استطاعت تحصيل انتباه غير مسبوق من المستخدمين والمستخدمات، وتكريس جدالات حول أهمية ما تنتجه من محتوى من عدمه.
يحاكي المتنبّي GPT
مغاني الشعب طيبًا في المغاني*** بمنزلة الربيع من الزمان
ولكن الفتى العربي فيها****** غريب الوجه واليد واللسان
ملاعب جنة لو سار فيها***** سليمان لسار بترجمان
– المتنبي
ليست السطور الستة التالية سوى محاولات نماذج إنتاج نصوص عربية لاستكمال أبيات أبو الطيب المتنبي الثلاثة الأولى.
فتى إذا ما نأت دار له**** تبوأ منها بأطراف البنان
وإني لأستغشي ما بي نعسة**** لعل خيالًا منك يلقى جانبًا
إذا الريح مالت في مغيصها ****ألقت بردها على ذي قفاف
وإنما الناس بالملوك لئام**** ولا الناس بالفارس المكين
ولا الناس بالمملوكين ولا**** الناس بالرعية والخدمان
ولو شئت نازعتني نصيحتي**** لوجدتني أنصح من غشيان
– «جاسمين»
في 21 كانون الأول الماضي، وتزامنًا مع يوم اللغة العربية (18 كانون الأول)، نشرت مجموعة بحثية مقرها مدينة فانكوفر غرب كندا نسخة أوليّة من ورقة بحثية تتحدث عن خمسة نماذج لإنتاج النصوص العربية تحمل اسم «جاسمين» (JASMINE). تدربت النماذج الضخمة نسبيًا على 400 غيغابايت تقريبًا من البيانات النصيّة العربية المحكيّة والفصحى، وتراوحت أعداد عواملها المتغيّرة بين 300 مليون و13 مليار. أولَت المجموعة شأنًا خاصًا في عملها للانحيازات الخوارزمية المتعلقة بالجندر أو العرق أو الدين، ولم تتسرع في إصدار النماذج واعدةً بجهد إضافي في هذا المجال. أنتجت نماذج «جاسمين» أيضًا، حسب الباحثين، مقالات في مجالات مختلفة منها السياسة والتاريخ والاقتصاد، لم يستطع خريجان جامعيان لغتهما الأم هي العربية تمييزها إجمالًا عن مقالات أخرى منتجةٍ بشريًا، كما استطاعت، بشكل ملفت إنما محدود، كتابة قصص قصيرةٍ ومحاكاة قصائد شعرية عربية.
لا تستطيع الخوارزميات عبر أنماطها الإحصائية خلق نصوص أدبية معقّدة أو معانٍ جديدة، لكنها ليست مجرد آلات نسخ للنصوص التي تدربت عليها.
راعت السطور الستة التي أنتجها أحد نماذج «جاسمين» بعض تفاصيل القصيدة الشعرية القديمة، إن لتشابه شكلها مع الأبيات المزدوجة على كل سطر، أو لانتهاء ثلاثة منها بالقافية نفسها (السطور المنتهية بالألف والنون: «البنان»، و«الخدمان»، و«غشيان»). كتب المتنبّي القصيدة خلال القرن العاشر الميلادي، أثناء إقامته لما يقارب الثلاثة أشهر في شيراز الواقعة في إيران اليوم. عبّر في أبياتها الأولى عن غربته وحنينه إلى العربية «غريب الوجه واليد واللسان»، كما عن مديحه لجمال منطقة «شعب بوّان» التي مر بها في طريقه «مغاني الشعب طيبًا في المغاني»، و«ملاعب جنة لو سار فيها، سليمان لسار بترجمان». لم ينسَ المتنبي في الأبيات اللاحقة كيل المديح لعضد الدولة، أحد أشهر الحكام البويهيين، الذي رد مكافئًا له على المديح المتكرر خلال إقامته القصيرة بأكثر من مائتي ألف درهم. كانت بعض سطور «جاسمين» الستة أقلّ تملّقًا من المتنبّي («وإنما الناس بالملوك لئام»، و«ولا الناس بالمملوكين ولا الناس بالرعية والخدمان»)، لكنّها حملت معاني غير مترابطة أحيانًا.
ليس أداء «جاسمين» مفاجئًا ولا يقتصر على نماذج اللغة العربية. يمتاز هذه النوع من النماذج بقدرته على محاكاة أشكال مختلفة من النصوص، نثرية كانت أم شعرية وتقنيّة، وعلى اختيار كلمات تترابط زمنيًا ولغويًا مع المحتوى الذي تسعى لإتمامه أو الإجابة عليه. يصبح كلام النموذج عن «الفتى» و«الخيال» و«الريح» مفهومًا هنا إحصائيًا لتواردها معًا، على الأرجح، في بيانات الشعر القديم التي استخدمت أثناء التدريب، أو مع كلمات أخرى تكرّرت مع ما تحدّث عنه المتنبي في الأبيات الثلاثة الأولى («الربيع»، و«ملاعب جنة»، و«الفتى العربي»). عند قراءة السطور الستة معًا، يغيب الترابط فيما بينها ومع الأبيات الأولى، وتصطدم «جاسمين» كما «شات جي بي تي» بصعوبة إنتاج معاني دقيقة ومعقّدة. قد يعني هذا، للوهلة الأولى، احتمال الاعتماد على هذه النماذج لكتابة النصوص البسيطة فقط، وألاّ دور لها في إنتاج النصوص المحمّلة بالأفكار والمعاني.
لكنّ الفصل ليس بهذه الثنائيّة.
فهم وإنتاج المعنى
في ورقة بحثية صدرت في آذار 2021، وصفت أربع باحثاتٍ في مجال الذكاء الاصطناعي النماذج الضخمة لانتاج النصوص بـ«الببغاوات»، للإشارة إلى إعادة الأخيرة كلماتٍ وجملٍ تحتويها البيانات التي تدربت عليها. حذرت الباحثات من ضخامة تلك النماذج لناحية كلفة تدريبها بيئيًا واقتصاديًا، ومن التسرّع لجمع البيانات دون تدقيق محكم بتنوعها لغويًا وثقافيًا، قبل التدريب. بتركيزها على الانحيازات الخوارزمية، تشرح الورقة كيفية تحوّلت نماذج الذكاء الاصطناعي لببغاوات تعكس الانحيازات في البيانات، وتضيء على احتمال تعميق تلك الانحيازات في حال استعملت النماذج لإنتاج نصوص أكثر في وقت أقصر عبر الأتمَتة. عند تبادل الحديث بين الإنسان ونموذج ذكاء اصطناعي لإنتاج النصوص، لا يمتلك الأخير قصدًا أو معنى، فيسارع لـ«حياكة» أنماط لغوية رآها في بيانات التدريب الضخمة، وبالتالي يصبح «ببغاءً إحصائيًا»، تتابع الباحثات.
لكن نماذج عدة أظهرت وقوع خوارزميات إنتاج النصوص بين طرفي امتلاك المعنى و«الوعي»، كما يروّج غالبًا مغالون تقنيون، وعدم امتلاك أي قدرة على تقدير المعنى عبر الأنماط التي تم تقديرها خلال التدريب، كما يشير وصف «الببغاوات». عند الطلب منها تفسير نكات لم تحتوها بيانات التدريب أو كتابة نصوص تحاكي أسلوب كاتبة معينة مثلًا، استطاعت بعض النماذج إتمام المهمة بشكل مقنع. أكثر من ذلك، لم تعجز خوارزميات إنتاج النصوص، ولا تلك التي تنتج الصور، عن محاكاة طلبات لا تبدو واقعية، كأن يُطلَب منها إنتاج صورة دب قطبي يسبح على سطح المريخ مثلًا، أو وصفة طعام بنبرة تشبه تلك التي كُتِبَ بها الدستور الأميركي.
أظهرت نماذج عدة وقوع خوارزميات إنتاج النصوص بين طرفي امتلاك المعنى والوعي، كما يروّج غالباً مغالون تقنيون، وعدم امتلاك أي قدرة على تقدير المعنى عبر الأنماط التي تم تقديرها خلال التدريب، كما يشير وصف «الببغاوات».
مع قدرتها على تحليل كمية من البيانات النصية تفوق ما يستطيع عقل بشري واحدٌ تحليله بكثير، تستطيع النماذج ربط مصطلحات وأفكار اطلعت عليها في فائض البيانات التي تدربت عليها، ثم اقتراحها لمن تستخدمها. تصبح الاقتراحات الخوارزمية هنا، أو بعضها فقط، جديدةً لربطها أفكارًا موجودة أصلًا في البيانات التي تدربت عليها، لا جديدة بحد ذاتها. تتشابه هذه العملية مع أحد جوانب القدرة البشرية على الإبداع، عبر استعمال مخزون المعلومات والأفكار التي يمكن الاطلاع عليها حتى نقطة زمنية ما، لكنها تفتقر إلى الجوانب التي مكّنت البشر من خلق أفكار أو ومضات جديدة، ومن ربط سياقات ومعانٍ معقّدة لا يمكن اختزالها بأنماط إحصائية. بمعنى آخر، لا تستطيع الخوارزميات عبر أنماطها الإحصائية خلق نصوص أدبية معقّدة أو معاني جديدة، لكنها ليست مجرد آلات نسخ للنصوص التي تدربت عليها.
في الشعر أو في الموسيقى، قد يترجم هذا نصوصًا ومقاطع صوتية استهلاكية وسريعة الإنتاج، وهو ما بدأ بالفعل، أو صورًا شعرية ونغماتٍ تتضح محدوديتها بعد تطبيع وجود هذه النماذج في حياتنا. على الجانب الآخر، قد يعني أيضًا اقتراحات خوارزمية لبدايات أعمال فنية تتكامل فيها قدرات البشر والآلة. في تشرين الأول 2021 مثلًا، عزفت أوركسترا بيتهوفن في مدينة بون الألمانية «سمفونيته العاشرة» بعد استعمال الذكاء الاصطناعي لإكمالها. أثناء العمل على السمفونية التي توفي بيتهوفن دون إكمالها، أنتج باحثون في مجال الذكاء الاصطناعي المئات من الاقتراحات الصوتية الجديدة عند كل خطوة، واختار مؤلفون موسيقيون الخيارات الأنسب لهم لمتابعة السمفونية.
شعريًا، قد تجذب نماذج GPT ومثيلاتها اهتمام عدد ممن لم يجذبهم شعر المتنبي من قبل، قد تثير اهتمام مستخدمين لإنتاجها مقاطع شعرية مسلية، أو قد تؤسس باقتراحاتها لإنتاجات بشرية جديدة. لكنها لم ولن تضاهي بلاغة أشعار