مقدمة إلى PandasAI: مكتبة Python للذكاء الاصطناعي التوليدي

Pandas هي المكتبة الأكثر انتشارًا لمُعالجة مجموعات البيانات وأطرها. حيث كانت هي المعيار المُستخدم لفترة طويلة. ولكن مع التقدم في الذكاء الاصطناعي ، تم تطوير مكتبة جديدة مفتوحة المصدر تُسمى PandasAI والتي تُضيف قدرات الذكاء الاصطناعي التوليدي إلى Pandas.

PandasAI لا تحل محل Pandas. بدلاً من ذلك ، فإنها تُعطي قدرات الذكاء الاصطناعي التوليدي. بهذه الطريقة ، يُمكنك إجراء تحليل البيانات من خلال الدردشة مع PandasAI. ثم تقوم بتلخيص ما يحدث في الخلفية وتُزوِّدك بمُخرجات استعلامك. تحقق من تعلم تحليلات البيانات مجانًا: أفضل مواقع الويب المُتوفرة.

1PD46rn0bVeyfKHkHVg7XsA DzTechs | مقدمة إلى PandasAI: مكتبة Python للذكاء الاصطناعي التوليدي

تثبيت PandasAI

PandasAI مُتاحة عبر PyPI (فهرس حزمة Python). يُمكنك البدء بإنشاء بيئة افتراضية جديدة إذا كنت تستخدم IDE محلي. ثم استخدم مدير حزمة PiP لتثبيتها.

pip install pandasai

قد تواجه خطأ تعارض تبعية مُشابه للخطأ الموضح أدناه إذا كنت تستخدم Google Colab.

1Hc3DJZkB2qWJOqUmY2ibeA DzTechs | مقدمة إلى PandasAI: مكتبة Python للذكاء الاصطناعي التوليدي

لا تقم بالرجوع إلى إصدار أقدم من إصدار IPython. ما عليك سوى إعادة تشغيل Runtime وتشغيل مجموعة التعليمات البرمجية مرة أخرى. سيتم حل المشكلة.

ملاحظة: كود المصدر الكامل مُتاح في مستودع Github.

فهم نموذج مجموعة البيانات

نموذج مجموعة البيانات الذي ستتعامل معه باستخدام PandasAI هي مجموعة بيانات أسعار الإسكان في كاليفورنيا من Kaggle. تحتوي مجموعة البيانات هذه على معلومات حول الإسكان من تعداد كاليفورنيا لعام 1990. حيث تحتوي على عشرة أعمدة تُقدم إحصائيات عن هذه المنازل. بطاقة البيانات لمساعدتك في معرفة المزيد حول مجموعة البيانات هذه مُتاحة على Kaggle. فيما يلي الصفوف الخمسة الأولى من مجموعة البيانات.

1s2Hi8PYQzrYRoFFrH4hJMQ DzTechs | مقدمة إلى PandasAI: مكتبة Python للذكاء الاصطناعي التوليدي

يمثل كل عمود إحصائية واحدة للمنزل.

ربط PandasAI بنموذج اللغة الكبير

لتوصيل PandasAI بنموذج لغة كبير (LLM) مثل نموذج OpenAI ، تحتاج إلى الوصول إلى مفتاح API الخاص به. للحصول على المفتاح ، انتقل إلى منصة OpenAI. ثم قم بتسجيل الدخول إلى حسابك. حدد API ضمن صفحة الخيارات التي تظهر.

1Y8C5R3 p69zrFAyr4F9XKw DzTechs | مقدمة إلى PandasAI: مكتبة Python للذكاء الاصطناعي التوليدي

بعد ذلك ، انقر فوق ملفك الشخصي وحدد خيار عرض مفاتيح API. في الصفحة التالية ، انقر فوق الزر “إنشاء مفتاح سري جديد”. أخيرًا ، قم بتسمية مفتاح API الخاص بك.

11Agd3qLeduWqSP5VnQq PQ DzTechs | مقدمة إلى PandasAI: مكتبة Python للذكاء الاصطناعي التوليدي

ستقوم OpenAI بإنشاء مفتاح API الخاص بك. انسخه أين ستحتاج إليه أثناء توصيل PandasAI بـ OpenAI. تأكد من الاحتفاظ بـ Secret Key بأمان حيث يُمكن لأي شخص لديه حق الوصول إليه إجراء مُكالمات إلى OpenAI نيابة عنك. ستقوم OpenAI بعد ذلك بشحن رسوم إلى حسابك مُقابل عدد المكالمات.

الآن بعد أن أصبح لديك مفتاح API ، أنشئ نصًا برمجيًا جديدًا من Python والصق الكود أدناه. لن تحتاج إلى تغيير هذا الكود لأنك ستبني عليه مُطالباتك في معظم الأوقات.

import pandas as pd
from pandasai import PandasAI

# Replace with your dataset or dataframe
df = pd.read_csv(“/content/housing.csv”)

# Instantiate a LLM
from pandasai.llm.openai import OpenAI
llm = OpenAI(api_token=”your API token”)

pandas_ai = PandasAI(llm)

يستورد الكود أعلاه كلاً من PandasAI و Pandas. ثم يقرأ مجموعة البيانات. أخيرًا ، يقوم بتجسيد OpenAI LLM.

أنت الآن جاهز للتحدث مع بياناتك. تحقق من كيفية إنشاء مثيل ChatGPT مُخصص ببياناتك الخاصة.

أداء مهام بسيطة باستخدام PandasAI

للاستعلام عن بياناتك ، قم بتمرير إطار البيانات والمُطالبة التي تُفضلها إلى مثيل فئة PandasAI. ابدأ بعرض الصفوف الخمسة الأولى من مجموعة البيانات الخاصة بك.

pandas_ai(df, prompt=’What are the first five rows of the dataset?’)

ناتج المُطالبة أعلاه هو كما يلي:

1 1s2Hi8PYQzrYRoFFrH4hJMQ DzTechs | مقدمة إلى PandasAI: مكتبة Python للذكاء الاصطناعي التوليدي

هذا الإخراج مُطابق لإخراج نظرة عامة على نموذج مجموعة البيانات سابقًا. هذا يدل على أنَّ PandasAI قدَّمت نتائج صحيحة ويُمكن الاعتماد عليها.

بعد ذلك ، تحقق من عدد الأعمدة الموجودة في مجموعة بياناتك.

pandas_ai(df, prompt=’How many columns are in the dataset? ‘)

تم إرجاع 10 وهو العدد الصحيح للأعمدة في مجموعة بيانات الإسكان في كاليفورنيا.

التحقق مما إذا كانت هناك قيم مفقودة في مجموعة البيانات.

pandas_ai(df, prompt=’Are there any missing values in the dataset?’)

تُرجع PandasAI أنَّ عمود total_bedrooms به 207 قيمة مفقودة ، وهذا صحيح مرة أخرى.

هناك الكثير من المهام البسيطة التي يُمكنك تحقيقها باستخدام PandasAI ، فأنت لست مُقيدًا بالمهام المذكورة أعلاه.

إجراء استعلامات مُعقَّدة باستخدام PandasAI

لا تدعم PandasAI المهام البسيطة فقط. يُمكنك أيضًا استخدامها لتنفيذ استعلامات مُعقَّدة في مجموعة البيانات. على سبيل المثال ، في مجموعة بيانات الإسكان ، إذا كنت تُريد تحديد عدد المنازل الموجودة على جزيرة ، والتي تبلغ قيمتها أكثر من 100.000 دولار ، وتحتوي على أكثر من 10 غرف ، يُمكنك استخدام المُطالبة أدناه.

pandas_ai(df,prompt= “How many houses have a value greater than 100000,” “ are in an island and total bedrooms is more than 10?”)

الناتج الصحيح هو خمسة. هذه هي نفس النتيجة التي قدمتها PandasAI.

قد يستغرق مُحلل البيانات للوصول إلى نتائج الاستعلامات المُعقَّدة بعض الوقت للكتابة والتصحيح. تتطلب المُطالبة أعلاه سطرين فقط من اللغة الطبيعية لإنجاز نفس المهمة. ما عليك سوى أن تضع في اعتبارك بالضبط ما تُريد تحقيقه ، وستتكفل PandasAI بالباقي. تحقق من طرق استخدام ChatGPT كمُحلل بيانات.

رسم المخططات باستخدام PandasAI

تُعد المخططات جزءًا حيويًا من أي عملية تحليل بيانات. تُساعد مُحللي البيانات على تصور البيانات بطريقة صديقة للإنسان. تحتوي PandasAI أيضًا على ميزة رسم المُخططات. عليك فقط تمرير إطار البيانات والتعليمات.

ابدأ بإنشاء رسم بياني لكل عمود في مجموعة البيانات. سيُساعدك هذا على تصور توزيع المُتغيِّرات.

pandas_ai(df, prompt= “Plot a histogram for each column in the dataset”)

الإخراج كالتالي:

1wsrngbRGJ0Yew76BT2982w DzTechs | مقدمة إلى PandasAI: مكتبة Python للذكاء الاصطناعي التوليدي

كانت PandasAI قادرةً على رسم المُخطط البياني لجميع الأعمدة دون الحاجة إلى تمرير أسمائها في المُطالبة.

يمكن لـ PandasAI أيضًا رسم المخططات دون إخبارها صراحةً بأي مُخطط يجب استخدامه. على سبيل المثال ، قد ترغب في معرفة ارتباط البيانات في مجموعة بيانات الإسكان. لتحقيق ذلك ، يُمكنك تمرير مطالبة على النحو التالي:

pandas_ai(df, prompt= “Plot the correlation in the dataset”)

ترسم PandasAI مصفوفة ارتباط كما هو موضح أدناه:

1W2Fy8PQt1gJO6Z2 qy2lvw DzTechs | مقدمة إلى PandasAI: مكتبة Python للذكاء الاصطناعي التوليدي

تختار المكتبة خريطة حرارية وترسم مصفوفة ارتباط.

تمرير إطارات بيانات مُتعددة إلى مثيل PandasAI

قد يكون العمل مع إطارات بيانات مُتعددة أمرًا صعبًا. خاصة بالنسبة لشخص جديد في تحليل البيانات. تسد PandasAI هذه الفجوة لأنَّ كل ما عليك فعله هو تمرير كل من إطارات البيانات والبدء في استخدام المُطالبات لمعالجة البيانات.

قم بإنشاء إطارين للبيانات باستخدام Pandas.

employees_data = {
 ‘EmployeeID’: [1, 2, 3, 4, 5],
 ‘Name’: [‘John’, ‘Emma’, ‘Liam’, ‘Olivia’, ‘William’],
 ‘Department’: [‘HR’, ‘Sales’, ‘IT’, ‘Marketing’, ‘Finance’]
}

salaries_data = {
 ‘EmployeeID’: [1, 2, 3, 4, 5],
 ‘Salary’: [5000, 6000, 4500, 7000, 5500]
}

employees_df = pd.DataFrame(employees_data)
salaries_df = pd.DataFrame(salaries_data)

يُمكنك أن تطرح على PandasAI سؤالاً يشمل كل من إطارات البيانات. ما عليك سوى تمرير كلا إطاري البيانات إلى مثيل PandasAI.

pandas_ai([employees_df, salaries_df], “Which employee has the largest salary?”)

تقوم بإرجاع Olivia وهي الإجابة الصحيحة مرة أخرى.

لم يكن إجراء تحليل البيانات أسهل من أي وقت مضى ، تُتيح لك PandasAI الدردشة مع بياناتك وتحليلها بسهولة. تحقق من أفضل تطبيقات وأداوت تحليل البيانات التي يُمكنك تعلم استخدامها بسرعة.

فهم التكنولوجيا التي تمد PandasAI

تُبسط PandasAI عملية تحليل البيانات وبالتالي تُوفر الكثير من الوقت لمُحللي البيانات. لكنها تُلخص ما يحدث في الخلفية. تحتاج إلى التعرف على الذكاء الاصطناعي التوليدي حتى تتمكن من الحصول على نظرة عامة حول كيفية عمل PandasAI تحت الغطاء. سيُساعدك هذا أيضًا على مواكبة أحدث الابتكارات في مجال الذكاء الاصطناعي التوليدي. يُمكنك الإطلاع الآن على الطرق التي سيُغيِّر بها الذكاء الاصطناعي التوليدي سوق العمل.

DzTech

أنا مهندس دولة مع خبرة واسعة في مجالات البرمجة وإنشاء مواقع الويب وتحسين محركات البحث والكتابة التقنية. أنا شغوف بالتكنولوجيا وأكرس نفسي لتقديم معلومات عالية الجودة للجمهور. يُمكنني أن أصبح موردًا أكثر قيمة للمُستخدمين الذين يبحثون عن معلومات دقيقة وموثوقة حول مُراجعات المُنتجات والتطبيقات المُتخصصة في مُختلف المجالات. إنَّ التزامي الثابت بالجودة والدقة يضمن أنَّ المعلومات المُقدمة جديرة بالثقة ومفيدة للجمهور. السعي المُستمر للمعرفة يدفعني إلى مواكبة أحدث التطورات التكنولوجية، مما يضمن نقل الأفكار المُشتركة بطريقة واضحة وسهلة المنال.
زر الذهاب إلى الأعلى