لماذا تُعد نافذة السياق التي تضم مليون رمز مُميز في Gemini 1.5 تغييرًا في قواعد اللعبة

شهد مجال معالجة اللغة الطبيعية (NLP) ثورة هائلة في السنوات الأخيرة، مع ظهور نماذج لغة كبيرة (LLMs) تُقدم قدرات استثنائية في فهم اللغة البشرية ومعالجتها. ويُعد نموذج Gemini 1.5 من أحدث هذه النماذج، حيث يُقدم إمكانيات سياقية هائلة. يأتي نموذج Google Gemini 1.5 الآن مُزوَّدًا بنافذة سياق ضخمة تضم مليون رمز مُميز، مما سيُقزم منافسيه المُباشرين مثل ChatGPT و Claude وغيرها من روبوتات الدردشة التي تعمل بالذكاء الاصطناعي.

تُعد النافذة السياقية التي تضم مليون رمز مُميز في Gemini 1.5 تغييرًا جذريًا في قواعد اللعبة، حيث يُتيح للنموذج فهمًا أعمق وأكثر دقة للغة. فمع سعة سياقية أكبر، يُمكن للنموذج تحليل المزيد من الكلمات والعبارات المُحيطة بكلمة أو جملة مُعينة، مما يُساعده على استنتاج المعنى بشكل أفضل. تحقق من وصول Gemini AI من Google: هل يبرز بفعاليَّة أكبر من ChatGPT في عالم الذكاء الاصطناعي؟

لماذا تُعد نافذة السياق التي تضم مليون رمز مُميز في Gemini 1.5 تغييرًا في قواعد اللعبة - الذكاء الاصطناعي

ما هي نافذة السياق؟

أثناء الرد على استفساراتك، مثل شرح مفهوم أو تلخيص نص، فإنَّ نماذج الذكاء الاصطناعي لها حدود على مقدار البيانات التي يُمكنها أخذها في الاعتبار لتوليد الاستجابة. يُطلق على الحد الأقصى لحجم النص الذي يُمكن مراعاته اسم نافذة السياق.

إليك طريقة أخرى للنظر إلى هذا المفهوم. لنفترض أنك ذهبت إلى محل بقالة لشراء بعض الخضروات والمُستلزمات المنزلية بدون قائمة البقالة الخاصة بك. الحد الأقصى لعدد البقالة التي تتذكرها عند التسوق هو نافذة السياق. كلما زاد عدد البقالة التي يُمكنك تذكرها، زادت فرص عدم إفساد خطط التسوق المُخصصة. وبالمثل، كلما كانت نافذة السياق لنموذج الذكاء الاصطناعي أكبر، زادت فرص النموذج في تذكر كل ما يحتاجه لتزويدك بأفضل النتائج.

في وقت كتابة هذا التقرير، كانت نافذة سياق Claude 2.1 من Anthropic بحجم 200 ألف رمز مُميز هي أكبر نافذة سياق لأي نموذج ذكاء اصطناعي مُتاح بشكل عام. ويتبعه GPT-4 Turbo مع نافذة سياق بحجم 128 ألف رمز مُميز. يوفر Google Gemini 1.5 نافذة سياقية تضم مليونًا، أي أكبر بأربع مرات من أي شيء آخر في السوق. يؤدي هذا إلى السؤال الكبير: ما الشيء المُميز في نافذة سياق مُكوَّنة من مليون رمز مُميز؟ تحقق من ما هو حد الرمز المُميز لـ ChatGPT وهل يُمكنك تجاوزه؟

لماذا تُعد نافذة السياق في Gemini 1.5 أمرًا كبيرًا

لماذا تُعد نافذة السياق التي تضم مليون رمز مُميز في Gemini 1.5 تغييرًا في قواعد اللعبة - الذكاء الاصطناعي

لتوضيح الأمر من منظور أكثر تفصيلًا، فإن نافذة السياق التي يبلغ حجمها 200 ألف الخاصة بـ Claude AI تعني أنه يُمكنه استيعاب كتاب يضم حوالي 150 ألف كلمة وتقديم إجابات عليه. هذا بالفعل ضخم. لكن Google Gemini 1.5 سيكون قادرًا على استيعاب 700000 كلمة دفعة واحدة!

عندما تقوم بتغذية كتلة نصية كبيرة في مُطالبات روبوتات الدردشة المدعومة بالذكاء الاصطناعي مثل ChatGPT أو Gemini، فإنها تحاول استيعاب أكبر قدر مُمكن من النص، ولكن مقدار ما يُمكنها استيعابه يعتمد على نافذة السياق الخاصة بها. لذلك، إذا كانت لديك محادثة تصل إلى 100 ألف كلمة على نموذج يُمكنه التعامل مع 28 ألف كلمة فقط، ثم تبدأ في طرح الأسئلة التي تتطلب منه الحصول على معرفة كاملة بمجموع 100 ألف كلمة من المحادثة، فأنت تقوم بإعداده للفشل.

تخيل أنك تشاهد 20 دقيقة فقط من فيلم مدته ساعة واحدة ولكن يُطلب منك شرح الفيلم بأكمله. إلى أي مدى ستكون نتائجك جيدة؟ إما أن ترفض الإجابة أو تقوم ببساطة باختلاق أشياء، وهو بالضبط ما سيفعله روبوت الدردشة الذي يعمل بالذكاء الاصطناعي، مما يُؤدي إلى هلوسة الذكاء الاصطناعي.

الآن، إذا كنت تعتقد أنك لم تُضطر مُطلقًا إلى إدخال 100 ألف كلمة في روبوت الدردشة، فهذا ليس كل الاعتبارات. تتجاوز نافذة السياق النص الذي تُغذيه نموذج الذكاء الاصطناعي في مُطالبة واحدة فقط. تأخذ نماذج الذكاء الاصطناعي في الاعتبار المُحادثة بأكملها التي أجريتها أثناء جلسة الدردشة للتأكد من أنَّ ردودها ذات صلة قدر الإمكان.

لذلك، على الرغم من أنك لا تقوم بتغذية النموذج بكتاب مُكوَّن من 100 ألف كلمة، إلا أنَّ محادثاتك ذهابًا وإيابًا والردود التي يُقدمها كلها تضيف إلى حساب نافذة السياق. هل تتساءل لماذا يستمر ChatGPT أو Gemini من Google في نسيان الأشياء التي قلتها له سابقًا في المحادثة؟ من المحتمل أنَّ مساحة نافذة السياق قد نفدت وبدأ في نسيان الأشياء.

تُعد نافذة السياق الأكبر ذات أهمية خاصة للمهام التي تتطلب فهمًا عميقًا للسياق، مثل تلخيص المقالات الطويلة، أو الإجابة على الأسئلة المُعقَّدة، أو الحفاظ على سرد مُتماسك في النص الذي تم إنشاؤه. هل تريد كتابة رواية مُكوَّنة من 50 ألف كلمة تحتوي على سرد مُتسق طوال الوقت؟ هل تريد نموذجًا يُمكنه “المشاهدة” والإجابة على الأسئلة في ملف فيديو مدته ساعة واحدة؟ أنت بحاجة إلى نافذة سياق أكبر!

باختصار، قد تعمل نافذة السياق الأكبر لـ Gemini 1.5 على تحسين أداء نموذج الذكاء الاصطناعي الخاص به بشكل كبير، مما يُقلل من الهلوسة ويزيد بشكل كبير من الدقة والقدرة على اتباع التعليمات بشكل أفضل.

هل سيُحقق Gemini 1.5 التوقعات؟

لماذا تُعد نافذة السياق التي تضم مليون رمز مُميز في Gemini 1.5 تغييرًا في قواعد اللعبة - الذكاء الاصطناعي

إذا سارت الأمور كما هو مُخطط لها، فمن المحتمل أن يتفوق Gemini 1.5 على أفضل نماذج الذكاء الاصطناعي في السوق. ومع ذلك، وبالنظر إلى إخفاقات Google العديدة في بناء نموذج مُستقر للذكاء الاصطناعي، فمن المهم توخي الحذر. إنَّ رفع نافذة السياق الخاصة بالنموذج وحدها لا يؤدي إلى تحسين النموذج تلقائيًا.

لقد استخدمت نافذة سياق Claude 2.1 بحجم 200 ألف لعدة أشهر منذ إصداره، وكان هناك شيء واحد واضح بالنسبة لي — يُمكن لنافذة سياق أكبر أن تُحسن بالفعل حساسية السياق، ولكن المشكلات المتعلقة بأداء النموذج الأساسي يُمكن أن تجعل السياق الأكبر مشكلة بالنسبة له.

هل سيُغير لنا Google Gemini 1.5 قواعد اللعبة؟ تمتلئ مواقع التواصل الاجتماعي حاليًا بمراجعات مُتوهجة لـ Gemini 1.5 من مستخدمي الوصول المُبكر. ومع ذلك، فإن معظم التقييمات ذات الخمس نجوم تنبع من حالات الاستخدام المتسرعة أو المبسطة. المكان الجيد للتحقق من أداء Gemini 1.5 في البرية هو داخل التقرير الفني لـ Google Gemini 1.5 [PDF]. ويظهر التقرير أنه حتى أثناء “الاختبار الخاضع للرقابة”، لم يتمكن النموذج من استرداد جميع التفاصيل الدقيقة للمُستندات بشكل جيد ضمن حجم نافذة السياق الخاصة به.

تعد نافذة السياق المُكوَّنة من مليون رمز مميز بالفعل إنجازًا تقنيًا مثيرًا للإعجاب، ولكن بدون القدرة على استرداد تفاصيل المستند بشكل موثوق، فإن نافذة السياق الأكبر تكون ذات قيمة عملية قليلة ويمكن أن تصبح سببًا لانخفاض الدقة والهلوسة الإضافية. يُمكنك الإطلاع الآن على ما بعد ChatGPT: رؤية مُستقبل روبوتات الدردشة والذكاء الاصطناعي التوليدي؟

زر الذهاب إلى الأعلى