ما هي مُسرِّعات الذكاء الاصطناعي في AMD Instinct؟

ليس هناك شك في أنَّ NVIDIA تُواصل هيمنتها على مساحة الحوسبة المُتوازية من خلال سلسلة بطاقات الرسومات الشائعة والمُتنوعة. ولكن مع وجود مُسرعات الذكاء الاصطناعي في Instinct من AMD التي تُزوِّد اثنين من أحدث وأكبر أجهزة الكمبيوتر العملاقة (Frontier و El Capitan) ودعم المُجتمع المُتزايد لمنصة ROCm مفتوحة المصدر ، ربما وجدت NVIDIA أكبر مُنافس لها حتى الآن.

إذن ما هي مُسرِّعات الذكاء الاصطناعي في AMD Instinct بالضبط؟ ما الذي يجعلها قوية ، وكيف تُقارن بوحدات معالجة الرسوميات Tensor من NVIDIA؟ تحقق من ما الفرق بين اللوحة الأم المُزوَّدة بمُعالج AMD والمُزوَّدة بمُعالج Intel؟

ما هي مُسرِّعات الذكاء الاصطناعي في AMD Instinct؟ - مراجعات

ما هي AMD Instinct؟

وحدات مُعالجة الرسومات AMD Instinct هي أجهزة مُخصصة للمؤسسات تُستخدم للحوسبة عالية الأداء (HPC) والمُعالجة المُسرَّعة بالذكاء الاصطناعي. على عكس وحدات معالجة الرسومات العادية ، المُتاحة على مُستوى المستهلك ، فإنَّ وحدات معالجة الرسومات Instinct مُخصصة للتعامل بشكل أفضل مع تعلم الذكاء الاصطناعي ومعالجة البيانات الضخمة والمهام الأخرى عالية الأداء من خلال ابتكارات البرمجيات والأجهزة.

تم استخدام سلسلة Instinct من AMD لتشغيل أول كمبيوتر عملاق لكسر حاجز حوسبة Exascale ، حيث كان يعمل عند 1.1 EFLOPs في عمليات مُزدوجة الدقة في الثانية. تُستخدم حاليًا أجهزة الكمبيوتر العملاقة التي تحتوي على وحدات معالجة الرسومات Instinct للبحث في علاجات السرطان والطاقة المُستدامة وتغير المناخ.

أصبحت الحوسبة عالية الأداء (HPC) جزءًا أساسيًا من عالمنا الحديث الذي يقوم بإجراء عمليات محاكاة وحسابات معقدة ضرورية للبحث العلمي والهندسة والأمن وغيرها من المجالات. ومع ذلك ، نظرًا لتزايد الطلب على HPC ، غالبًا في أجهزة الكمبيوتر العملاقة ومراكز البيانات الكبيرة ، فقد ازداد القلق بشأن تأثيرها البيئي. في السنوات الأخيرة ، كان هناك تركيز متزايد على استدامة مركز البيانات بالنظر إلى الآثار المُترتبة على التكلفة الإجمالية للملكية والشواغل المناخية.

كيف تُسرع وحدات مُعالجة الرسومات Instinct تقنيات الذكاء وحوسبة عالية الأداء

للحصول على أقوى الخوادم الرئيسية وأجهزة الكمبيوتر العملاقة في العالم لتحقيق معالجة على مستوى Exascale ، كان لابد من تجهيز مُسرِّعات AMD Instinct بالعديد من التحسينات والابتكارات التكنولوجية.

دعونا نناقش بعض التقنيات الجديدة والمُحدَّثة المستخدمة في وحدات معالجة الرسومات AMD Instinct.

1. تقنية الهندسة المعمارية (CDNA)

ما هي مُسرِّعات الذكاء الاصطناعي في AMD Instinct؟ - مراجعات

استخدمت مسرعات AMD Instinct الحديثة (بدءًا من MI100) بنية CDNA الخاصة بالشركة.

تُركِز CDNA بشكل أساسي على ميزات مثل المعالجة المتوازية ، والتسلسل الهرمي للذاكرة ، وأداء الحساب المحسّن من خلال تقنية Matrix Core الخاصة بها. حتى HPC و AI أو تعلم الآلة الذي يتم تشغيله على خوادم فردية يُمكن دعمه بواسطة CDNA ، بالإضافة إلى أجهزة كمبيوتر Exascale الضخمة.

تعمل تقنية Matrix Core من AMD على تسريع تعلم الذكاء الاصطناعي من خلال دعم العمليات مُختلطة الدقة. تسمح القدرة على الحساب بدقة مختلفة لوحدات معالجة الرسومات Instinct بحساب عمليات المصفوفة بكفاءة بناءً على مستوى الدقة المطلوبة.

تتضمن تنسيقات دقة الحساب الأكثر شيوعًا FP64 و FP32 و FP16 و BF16 و INT8. يشير FP إلى Floating Point و BF لـ Brain Floating Point و INT لـ Integer. كلما زاد الرقم المقابل للتنسيق ، زادت دقة الحساب. يُعرف التشغيل عند 64 بت بالدقة المزدوجة. مع 32 بت ، تكون الدقة أحادية ، و 16 بت نصف الدقة ، وما إلى ذلك.

نظرًا لأن جزءًا كبيرًا من تدريب نماذج التعلم العميق لا يتطلب الكثير من الدقة ، فإن امتلاك القدرة على حساب عمليات المصفوفة بنصف الدقة أو حتى ربع الدقة للاستدلال يقلل بشكل كبير من عبء العمل ، وبالتالي تسريع تعلم الذكاء الاصطناعي. تحقق من My AI من Snapchat أو ChatGPT: أيهما يجب أن تستخدمه؟

2. ذاكرة النطاق الترددي العالي (HBM)

ما هي مُسرِّعات الذكاء الاصطناعي في AMD Instinct؟ - مراجعات

يأتي كل مُسرِّع AMD Instinct مع ما يصل إلى 880 Matrix Cores. مع معالجات Matrix Core من AMD القادرة على إجراء 383 TFLOPs من العمليات الحسابية نصف الدقيقة ، من الضروري وجود ذاكرة فائقة السرعة. تأتي أحدث عروض Instinct من AMD مزودة بذاكرة عرض النطاق الترددي العالي (HBM) بدلاً من ذاكرة DDR4 أو DDR5 RAM المعتادة.

على عكس الذاكرة التقليدية ، تستخدم HBM ما يُعرف بالبنية المكدسة ثلاثية الأبعاد. يشير هذا النوع من الهندسة المعمارية إلى نهج التصميم حيث يتم تكديس نماذج DRAM رأسياً فوق بعضها. يُتيح ذلك تكديس النماذج على كل من المحور الرأسي والأفقي ، ومن هنا جاء مُصطلح التراص ثلاثي الأبعاد.

باستخدام تقنية التراص ثلاثية الأبعاد هذه ، يُمكن أن تتمتع HBM بسعات ذاكرة فعلية تصل إلى بضع مئات من الجيجابايت لكل وحدة ، في حين أن DRR5 يمكنه فقط القيام بما يصل إلى عشرات الجيجابايت لكل وحدة. بصرف النظر عن السعة ، من المعروف أيضًا أن HBM تتمتع بأداء أعلى من حيث معدل النقل وكفاءة طاقة أفضل من ذاكرة DDR العادية.

3. Infinity Fabric

من الابتكارات الأخرى المُضمَّنة في وحدات معالجة الرسومات Instinct هي تقنية Infinity Fabric من AMD. إنَّ Infinity Fabric هو نوع من أنظمة الترابط التي تربط وحدات المعالجة المركزية ووحدات معالجة الرسومات بطريقة ديناميكية ذكية. هذا يسمح للمُكوِّنات بالتواصل بكفاءة مع بعضها البعض.

باستخدام Infinity Fabric ، بدلاً من توصيل المُكوِّنات بناقل عادي ، يتم الآن توصيل المُكوِّنات في تشكيلة تُشبه الشبكة حيث يُمكن أن يصل عرض النطاق الترددي إلى عدة مئات من الجيجابايت في الثانية.

بصرف النظر عن الاتصال البيني الشبيه بالشبكة ، تستخدم Infinity Fabric أيضًا مُستشعرات مدمجة في كل نموذج للتحكم ديناميكيًا في التردد ومعدلات نقل البيانات والسلوكيات التكيفية الأخرى ، وتحسين الأداء وتقليل زمن الوصول.

4. منصة تطوير ROCm

تُعد CUDA (بنية الجهاز المُوحد للحوسبة) من NVIDIA منصة التطوير الأكثر استخدامًا لتدريب نماذج الذكاء الاصطناعي. تكمن مشكلة CUDA في أنها تعمل فقط مع وحدات معالجة الرسومات NVIDIA. هذا هو أحد الأسباب الرئيسية التي تجعل NVIDIA تمتلك الغالبية العظمى من حصص السوق لمسرعات HPC و AI.

مع رغبة AMD في الحصول على جزء أكبر من سوق HPC و AI ، كان عليهم تطوير منصتهم الخاصة ، ROCm (Radeon Open Compute). ROCm هي منصة برمجية مفتوحة المصدر تسمح باستخدام Instinct GPU كمسرعات للذكاء الاصطناعي.

على الرغم من أنها ليست بالضرورة جزءًا من أجهزة Instinct ، إلا أن ROCm أساسية عندما يتعلق الأمر ببقاء خط Instinct لوحدات معالجة الرسومات. مع ROCm ، يحصل المطورون والباحثون على أدوات ROCm والمترجم وبرامج تشغيل kernel ومجموعة كاملة من المكتبات والوصول إلى أطر عمل مثل TensorFlow و PyTorch للتطوير باستخدام لغة برمجة الذكاء الاصطناعي المفضلة لديهم.

كيف تُقارن مسرعات الذكاء الاصطناعي في AMD Instinct بنظرياتها في Radeon؟

تقدم AMD تشكيلة Instinct الخاصة بوحدات معالجة الرسومات للمؤسسات ووحدات معالجة الرسومات Radeon للمُستهلكين الاعتياديين. كما تمت مناقشته سابقًا ، يستخدم مُعالج Instinct بنية CDNA من AMD و HBM و Infinity Fabric للربط البيني. على العكس من ذلك ، تستخدم معالجات Radeon بنية RDNA من AMD وذاكرة DDR6 و Infinity Cache.

على الرغم من أنَّ سلسلة Radeon من مُسرعات الذكاء الاصطناعي الأقل قدرة ، إلا أنها لا تزال تحزم واحدة أو اثنتين من مراكز تسريع الذكاء الاصطناعي لكل وحدة حسابية. تحتوي أحدث وحدة معالجة رسومات Radeon RX7900 XT على نواتين تسريع للذكاء الاصطناعي لكل وحدة حسابية ، مما يسمح بـ 103 TFLOPs من نصف الدقة القصوى و 52 TFLOPs من ذروة الدقة الفردية.

بينما تُعد سلسلة Instinct من وحدات معالجة الرسومات أكثر ملاءمة لـ LLMs و HPC ، يُمكن استخدام مسرعات Radeon AI لضبط النماذج المدربة مسبقًا والاستنتاج والمهام التي تتطلب رسومات مكثفة.

مقارنة بين AMD Instinct و NVIDIA Tensor

وفقًا لاستطلاع TrendForce ، تمتلك NVIDA حوالي 80% من حصة السوق لوحدات معالجة الرسومات للخوادم ، بينما تمتلك AMD حوالي 20% المُتبقية فقط. هذا النجاح الساحق من NVIDIA يرجع إلى أنها شركة مُتخصصة في تصميم وتجميع وحدة معالجة الرسومات. يُتيح لها ذلك تصميم وحدات معالجة رسومات أفضل أداءً لا مثيل لها في العروض الأخرى.

دعونا نقارن Instinct MI205X من AMD و H100SXM5 من NVIDIA باستخدام مواصفات من موقع AMD الرسمي وورقة بيانات NVIDIA الخاصة بها:

نوع وحدة معالجة الرسومات FP64 (TFLOPs) FP32 (TFLOPs) FP16 (TFLOPs) INT8 (TFLOPs)
AMD Instinct MI250X 30.0 60.0 1000 2000
NVIDIA H100SXMS 47.9 95.7 383.2 383

كما يُمكن رؤيته في الجدول ، فإنَّ MI250X من AMD تعمل بشكل أفضل من حيث الدقة المزدوجة والحسابات نصف الدقيقة ، في حين أنَّ H100SXMS من NVIDIA أفضل بكثير من حيث حسابات المصفوفة نصف الدقة وربع الدقة. هذا يجعل MI250X من AMD أكثر مُلاءمة لـ HPC بينما H100SXMS من NVIDIA مع التعلم والاستنتاج بالذكاء الاصطناعي. تحقق من مقارنة بين بطاقات الرسومات من AMD و NVIDIA على Linux: أيهما يجب أن تستخدم؟

مُستقبل معالجات AMD Instinct

على الرغم من أنَّ أحدث عروض AMD ، MI250X ، مُصمم لـ HPC ، فإنَّ MI300 القادمة هي أكثر توجهاً نحو التدريب على الذكاء الاصطناعي. تم الإعلان عن مُسرع الذكاء الاصطناعي هذا ليكون APU ، حيث يجمع بين وحدة معالجة الرسومات ووحدة المعالجة المركزية في حزمة واحدة. يسمح هذا لوحدة معالجة الرسومات MI300 باستخدام بنية CNDA3 Unified Memory APU ، حيث ستستخدم وحدة معالجة الرسومات (GPU) ووحدة المعالجة المركزية (CPU) ذاكرة واحدة فقط ، مما يزيد من الكفاءة ويُقلل السعر.

على الرغم من أنَّ AMD لن تتنافس مع NVIDIA في سوق مسرع الذكاء الاصطناعي اليوم ، فبمجرد إطلاق MI300 وتحسين ROCm ، قد تكون سلسلة Instinct من AMD جيدة بما يكفي لانتزاع جزء كبير من سوق مُسرعات الذكاء الاصطناعي من NVIDIA. يُمكنك الإطلاع الآن على ما الفرق بين Nvidia GTX و Nvidia RTX؟

DzTech

أنا مهندس دولة مع خبرة واسعة في مجالات البرمجة وإنشاء مواقع الويب وتحسين محركات البحث والكتابة التقنية. أنا شغوف بالتكنولوجيا وأكرس نفسي لتقديم معلومات عالية الجودة للجمهور. يُمكنني أن أصبح موردًا أكثر قيمة للمُستخدمين الذين يبحثون عن معلومات دقيقة وموثوقة حول مُراجعات المُنتجات والتطبيقات المُتخصصة في مُختلف المجالات. إنَّ التزامي الثابت بالجودة والدقة يضمن أنَّ المعلومات المُقدمة جديرة بالثقة ومفيدة للجمهور. السعي المُستمر للمعرفة يدفعني إلى مواكبة أحدث التطورات التكنولوجية، مما يضمن نقل الأفكار المُشتركة بطريقة واضحة وسهلة المنال.
زر الذهاب إلى الأعلى