من خلال توفير تقنية GPT في روبوت دردشة قوي وسهل الاستخدام ، أصبح ChatGPT نموذج الذكاء الاصطناعي الأكثر شيوعًا في العالم. حيث يستخدمه العديد من الأشخاص لبدء مُحادثات جذابة والإجابة على الاستفسارات وتقديم اقتراحات إبداعية والمُساعدة في البرمجة والكتابة. ومع ذلك ، فإنَّ ChatGPT محدود لأنه لا يُمكنك تخزين بياناتك للاستخدام الشخصي على المدى الطويل ، والنقطة السلبية الرئيسية هي توفره على بيانات المعرفة حتى سبتمبر 2021.
كحل بديل ، يُمكن استخدام API من OpenAI و LangChain لتزويد ChatGPT ببيانات مُخصصة ومعلومات مُحدثة بعد عام 2021 لإنشاء مثيل ChatGPT مُخصص. تحقق من مُقارنة بين ChatGPT و Google Gemini: أي نموذج هو الأفضل في البرمجة؟
روابط سريعة
لماذا قد ترغب في إنشاء ChatGPT ببيانات مُخصصة؟
يُوفر تغذية ChatGPT ببيانات مُخصصة وتوفير معلومات محدثة تتجاوز تاريخ انتهاء المعرفة العديد من الفوائد التي تزيد عن مجرد استخدام ChatGPT كالمُعتاد. فيما يلي عدد قليل منها:
- التفاعلات المُحددة: من خلال تزويد ChatGPT ببيانات مُخصصة ، يُمكن للمُستخدمين إنشاء تجربة أكثر تخصيصًا. يمكن تدريب النموذج على مجموعات بيانات محددة ذات صلة بالمستخدمين الفرديين أو المؤسسات ، مما يؤدي إلى استجابات مُصممة وفقًا لاحتياجاتهم وتفضيلاتهم الفريدة.
- الخبرة الخاصة بالمجال: يسمح تكامل البيانات المُخصصة لـ ChatGPT بالتخصص في مجالات أو صناعات مُعينة. يمكن تدريبه على المعرفة والمُصطلحات والاتجاهات الخاصة بالصناعة ، مما يُتيح استجابات أكثر دقة وأكثر تفصيلاً في تلك المجالات المُحددة.
- المعلومات الحالية والدقيقة: يضمن الوصول إلى المعلومات المُحدثة أن يبقى ChatGPT مواكبًا لأحدث التطورات والمعرفة. يمكن أن يقدم ردودًا دقيقة بناءً على الأحداث أو الأخبار أو الأبحاث الأخيرة ، مما يجعله مصدرًا أكثر موثوقية للمعلومات.
الآن بعد أن فهمت أهمية توفير بيانات مُخصصة لـ ChatGPT ، فإليك خطوة بخطوة حول كيفية القيام بذلك على الكمبيوتر المحلي الخاص بك.
الخطوة 1: تثبيت وتنزيل التطبيقات والبرامج النصية المُعدة مسبقًا
يُرجى ملاحظة أنَّ الإرشادات التالية خاصة بجهاز يعمل بنظام Windows 10 أو Windows 11.
لتوفير بيانات مُخصصة لـ ChatGPT ، ستحتاج إلى تثبيت وتنزيل أحدث إصدار من Python3 و Git و Microsoft C++ والبرنامج النصي ChatGPT-recovery من GitHub. إذا كان لديك بالفعل بعض التطبيقات المُثبتة على الكمبيوتر الخاص بك ، فتأكد من تحديثها بأحدث إصدار لتجنب أي عوائق أثناء العملية.
ابدأ بالتثبيت:
تنزيل: Python3 (مجانًا)
تنزيل: Git (مجانًا)
تنزيل: Microsoft Visual Build Tools (مجانًا)
ملاحظات حول تثبيت Python3 و Microsoft C++
عند تثبيت Python3 ، تأكد من تحديد خيار Add python.exe to PATH قبل النقر فوق التثبيت الآن. هذا مُهم لأنه يسمح لك بالوصول إلى Python في أي دليل على الكمبيوتر الخاص بك.
عند تثبيت Microsoft C++ ، ستحتاج إلى تثبيت Microsoft Visual Studio Build Tools أولاً. بمجرد التثبيت ، يُمكنك تحديد خيار تطوير سطح المكتب باستخدام C++ والنقر فوق تثبيت مع تحديد جميع الأدوات الاختيارية تلقائيًا على الشريط الجانبي الأيمن.
الآن بعد أن قمت بتثبيت أحدث إصدارات Python3 و Git و Microsoft C++ ، يُمكنك تنزيل برنامج Python النصي للاستعلام بسهولة عن البيانات المحلية المُخصصة.
تنزيل: ChatGPT-retrieval script (مجانًا)
لتنزيل البرنامج النصي ، انقر فوق Code ، ثم حدد Download ZIP. يجب أن يؤدي ذلك إلى تنزيل برنامج Python النصي في الدليل الافتراضي أو المُحدد.
بمجرد التنزيل ، يُمكننا الآن إعداد بيئة محلية. تحقق من كيفية استخدام ChatGPT لإتقان فن رواية القصص.
الخطوة 2: إعداد البيئة المحلية
لإعداد البيئة ، ستحتاج إلى فتح Terminal في مجلد chatgpt-recovery-main الذي قمت بتنزيله. للقيام بذلك ، افتح مجلد chatgpt-recovery-main ، وانقر بزر الماوس الأيمن ، وحدد فتح في Terminal.
بمجرد فتح Terminal ، انسخ هذا الأمر والصقه:
pip install langchain openai chromadb tiktoken unstructured
يستخدم هذا الأمر مدير حزم Python لإنشاء وإدارة بيئة Python الافتراضية المطلوبة.
بعد إنشاء البيئة الافتراضية ، نحتاج إلى توفير مفتاح API من OpenAI للوصول إلى خدماتها. سنحتاج أولاً إلى إنشاء مفتاح API من موقع مفاتيح OpenAI API عن طريق النقر فوق إنشاء مفتاح سري جديد ، وقم بإضافة اسم للمفتاح ، ثم الضغط على زر إنشاء مفتاح سري.
سيتم تزويدك بسلسلة من الأحرف. هذا هو مفتاح OpenAI API الخاص بك. قم بنسخه بالنقر فوق رمز النسخ الموجود بجانب مفتاح API. لاحظ أنَّ مفتاح واجهة برمجة التطبيقات يجب أن يظل سريًا. لا تُشاركه مع الآخرين إلا إذا كنت تنوي فعلاً أن يستخدموه معك.
بمجرد النسخ ، ارجع إلى مجلد chatgpt-recovery-main وافتح ملف Constants باستخدام “المفكرة”. الآن استبدل العنصر النائب بمفتاح API الخاص بك. تذكر أن تحفظ الملف!
الآن بعد أن قمت بإعداد بيئتك الافتراضية بنجاح وإضافة مفتاح OpenAI API الخاص بك كمُتغيِّر بيئة. يمكنك الآن تقديم بياناتك المُخصصة إلى ChatGPT.
الخطوة 3: إضافة البيانات المُخصصة
لإضافة بيانات مُخصصة ، ضع جميع بياناتك النصية المُخصصة في مجلد Data داخل chatgpt-recovery-main. قد يكون تنسيق البيانات النصية بصيغة PDF أو TXT أو DOC.
كما ترى من لقطة الشاشة أعلاه ، لقد أضفت ملفًا نصيًا يحتوي على جدول شخصي مُكون ، ومقال كتبته على مسرّعات Instinct من AMD ، ووثيقة PDF.
الخطوة 4: الاستعلام عن المعلومات باستخدام ChatGPT من خلال Terminal
يُتيح البرنامج النصي بـ Python الاستعلام عن المعلومات من البيانات المُخصصة التي أضفناها إلى مجلد البيانات والإنترنت. بمعنى آخر ، سيكون لديك حق الوصول إلى الواجهة الخلفية المُعتادة لـ ChatGPT وجميع البيانات المخزنة محليًا في مجلد البيانات.
لاستخدام البرنامج النصي ، قم بتشغيل chatgpt.py ثم أضف سؤالك أو استعلامك كوسيطة.
python chatgpt.py “YOUR QUESTION”
تأكد من وضع أسئلتك بين علامات الاقتباس.
لاختبار ما إذا كنا قد قمنا بتغذية ChatGPT ببياناتنا بنجاح ، سأطرح سؤالًا شخصيًا بخصوص ملف Sched.txt الشخصي.
لقد عمل النموذج! هذا يعني أنَّ ChatGPT كان قادرًا على قراءة الملف الشخصي الذي تم توفيره مُسبقًا. الآن دعنا نرى ما إذا كنا قد نجحنا في تغذية ChatGPT بالمعلومات التي لا يعرفها بسبب تاريخ توقف قاعدة المعرفة.
كما ترى ، فقد وصف بشكل صحيح AMD Instinct MI250x ، والذي تم إصداره بعد تاريخ توقف قاعدة المعرفة لـ ChatGPT -3.
حدود مثيل ChatGPT المُخصص
على الرغم من أنَّ تغذية GPT-3.5 ببيانات مُخصصة يفتح المزيد من الطرق لتطبيق واستخدام LLM ، إلا أنَّ هناك بعض العيوب والقيود.
أولاً ، تحتاج إلى تقديم جميع البيانات بنفسك. لا يزال بإمكانك الوصول إلى جميع المعارف الخاصة بـ GPT-3.5 حتى تاريخ انتهاء المعرفة ؛ ومع ذلك ، يجب عليك تقديم كافة البيانات الإضافية. هذا يعني أنه إذا كنت تريد أن يكون نموذجك المحلي على دراية بموضوع معين على الإنترنت لا يعرفه GPT-3.5 بالفعل ، فسيتعين عليك الانتقال إلى الإنترنت وكشط البيانات بنفسك وحفظها كنص على مجلد بيانات chatgpt-recovery-main.
هناك مشكلة أخرى وهي أنَّ الاستعلام المُخصص على ChatGPT يستغرق وقتًا أطول للتحميل عند مُقارنته بسؤال ChatGPT مباشرة.
أخيرًا ، الطراز الوحيد المتاح حاليًا هو GPT-3.5 Turbo. لذا ، حتى إذا كان لديك وصول إلى GPT-4 ، فلن تتمكن من استخدامه لتشغيل مثيل ChatGPT المُخصص الخاص بك. تحقق من التطبيقات التي دمجت نموذج GPT-4 في جوهرها ، ولكن كيف تعمل؟
الدردشة المُخصصة رائعة ولكنها محدودة
يعد توفير البيانات المُخصصة لـChatGPT طريقة فعَّالة لتحقيق أقصى استفادة من النموذج. من خلال هذه الطريقة ، يُمكنك تغذية النموذج بأي بيانات نصية تُريدها والمطالبة بها تمامًا مثل ChatGPT العادي ، وإن كان ذلك مع بعض القيود. ومع ذلك ، سيتغير هذا في المستقبل حيث يصبح من الأسهل دمج بياناتنا مع LLM ، إلى جانب الوصول إلى أحدث طراز GPT-4. يُمكنك الإطلاع الآن على إشارات إلى أنك تتحدث إلى روبوت يعمل بالذكاء الاصطناعي.