Что такое ускорители искусственного интеллекта AMD Instinct?

Нет сомнений в том, что NVIDIA продолжает доминировать в области параллельных вычислений со своими популярными и разнообразными сериями графических карт. Но благодаря ускорителям искусственного интеллекта Instinct от AMD, на которых работают два ее новейших и лучших суперкомпьютера (Frontier и El Capitan), и растущей поддержке сообществом платформы ROCm с открытым исходным кодом, NVIDIA, возможно, нашла своего крупнейшего конкурента.

Так что же такое ускорители искусственного интеллекта AMD Instinct? Что делает его мощным и чем он отличается от графических процессоров NVIDIA Tensor? Проверять В чем разница между материнской платой AMD и процессором Intel?

Что такое ускорители искусственного интеллекта AMD Instinct? - отзывы

Что такое AMD Instinct?

Графические процессоры AMD Instinct — это корпоративное оборудование, используемое для высокопроизводительных вычислений (HPC) и обработки с ускорением ИИ. В отличие от обычных графических процессоров потребительского уровня, графические процессоры Instinct предназначены для более эффективного обучения ИИ, обработки больших данных и других высокопроизводительных задач благодаря программным и аппаратным инновациям.

Серия AMD Instinct использовалась для питания первого суперкомпьютера, который преодолел барьер экзафлопсных вычислений, работая со скоростью 1.1 EFLOP в операциях с двойной точностью в секунду. Суперкомпьютеры с графическими процессорами Instinct в настоящее время используются для исследования методов лечения рака, устойчивой энергетики и изменения климата.

Высокопроизводительные вычисления (HPC) стали неотъемлемой частью нашего современного мира, выполняя сложные симуляции и вычисления, необходимые для научных исследований, проектирования, безопасности и других областей. Однако по мере роста спроса на HPC, часто в суперкомпьютерах и крупных центрах обработки данных, возникает озабоченность по поводу его воздействия на окружающую среду. В последние годы повышенное внимание уделяется устойчивости центров обработки данных, учитывая последствия для общей стоимости владения и проблемы климата.

Как графические процессоры Instinct ускоряют интеллектуальные и высокопроизводительные вычислительные технологии

Чтобы самые мощные в мире главные серверы и суперкомпьютеры могли достичь обработки уровня Exascale, ускорители AMD Instinct должны были быть оснащены множеством технологических усовершенствований и инноваций.

Давайте обсудим некоторые из новых и обновленных технологий, используемых в графических процессорах AMD Instinct.

1. Технологическая архитектура (CDNA)

Что такое ускорители искусственного интеллекта AMD Instinct? - отзывы

Современные ускорители AMD Instinct (начиная с MI100) используют архитектуру CDNA компании.

CDNA в основном фокусируется на таких функциях, как параллельная обработка, иерархия памяти и улучшенная вычислительная производительность благодаря технологии Matrix Core. Даже высокопроизводительные вычисления, искусственный интеллект или машинное обучение, работающие на отдельных серверах, могут поддерживаться CDNA, а также суперкомпьютерами Exascale.

Технология AMD Matrix Core ускоряет обучение ИИ, поддерживая операции со смешанной точностью. Возможность вычислений с разным разрешением позволяет графическим процессорам Instinct эффективно выполнять матричные операции на основе желаемого уровня точности.

Наиболее популярные форматы разрешения вычислений включают FP64, FP32, FP16, BF16 и INT8. FP означает с плавающей запятой, BF означает с плавающей запятой мозга, а INT означает целое число. Чем выше число, соответствующее формату, тем выше точность расчета. Операция в 64-битном режиме известна как двойная точность. С 32-разрядным — с одинарной точностью, с 16-разрядным — с половинной точностью и так далее.

Поскольку большая часть обучения моделей глубокого обучения не требует большой точности, возможность вычислять матричные операции с половиной или даже четвертью точности логического вывода значительно снижает рабочую нагрузку, тем самым ускоряя обучение ИИ. Проверять Мой ИИ из Snapchat или ChatGPT: что использовать?

2. Память с высокой пропускной способностью (HBM)

Что такое ускорители искусственного интеллекта AMD Instinct? - отзывы

Каждый ускоритель AMD Instinct включает до 880 матричных ядер. С процессорами AMD Matrix Core, способными выполнять 383 терафлопс при вычислениях за полминуты, крайне важна сверхбыстрая память. Последнее предложение AMD Instinct поставляется с памятью с высокой пропускной способностью (HBM) вместо обычной оперативной памяти DDR4 или DDR5.

В отличие от традиционной памяти, HBM использует так называемую трехмерную стековую архитектуру. Этот тип архитектуры относится к подходу к проектированию, при котором модули DRAM располагаются вертикально друг над другом. Это позволяет размещать модели как по вертикальной, так и по горизонтальной оси, отсюда и термин 3D-стекинг.

Благодаря этой технологии трехмерного стекирования объем физической памяти HBM может составлять несколько сотен гигабайт на модуль, в то время как DRR3 может иметь только до десятков гигабайт на модуль. Известно, что помимо емкости, HBM также обладает более высокой пропускной способностью и лучшей энергоэффективностью, чем обычная память DDR.

3. Бесконечная ткань

Еще одна инновация, встроенная в графические процессоры Instinct, — это технология AMD Infinity Fabric. Infinity Fabric — это тип многопоточной системы, которая динамично и интеллектуально соединяет центральные и графические процессоры. Это позволяет компонентам эффективно взаимодействовать друг с другом.

Благодаря Infinity Fabric компоненты теперь не подключаются к обычной шине, а подключаются в сетевой конфигурации, где пропускная способность может достигать нескольких сотен гигабайт в секунду.

Помимо сетевого соединения, Infinity Fabric также использует датчики, встроенные в каждую модель, для динамического управления частотой, скоростью передачи данных и другими адаптивными функциями, повышая производительность и уменьшая задержку.

4. Платформа разработки ROCm

CUDA (унифицированная архитектура вычислительных машин) от NVIDIA — наиболее широко используемая платформа разработки для обучения моделей ИИ. Проблема с CUDA в том, что он работает только с графическими процессорами NVIDIA. Это одна из основных причин, по которой NVIDIA владеет подавляющим большинством долей рынка ускорителей высокопроизводительных вычислений и искусственного интеллекта.

Поскольку AMD хотела получить большую долю рынка высокопроизводительных вычислений и искусственного интеллекта, им пришлось разработать собственную платформу ROCm (Radeon Open Compute). ROCm — это программная платформа с открытым исходным кодом, которая позволяет использовать графические процессоры Instinct в качестве ускорителей искусственного интеллекта.

Хотя ROCm не обязательно является частью аппаратного обеспечения Instinct, он играет ключевую роль, когда речь идет о выживании линейки графических процессоров Instinct. Благодаря ROCm разработчики и исследователи получают инструменты ROCm, компилятор, драйверы ядра, полный набор библиотек и доступ к таким платформам, как TensorFlow и PyTorch, для разработки на своем любимом языке программирования ИИ.

Чем ускорители искусственного интеллекта AMD Instinct отличаются от своих аналогов Radeon?

AMD предлагает линейку корпоративных графических процессоров Instinct и графических процессоров Radeon для массового потребителя. Как обсуждалось ранее, процессор Instinct использует архитектуру CDNA от AMD, HBM и Infinity Fabric для соединения. И наоборот, процессоры Radeon используют архитектуру AMD RDNA, память DDR6 и кэш-память Infinity.

Хотя серия Radeon менее эффективна в качестве ускорителей искусственного интеллекта, они по-прежнему содержат одно или два ядра ускорения искусственного интеллекта на вычислительную единицу. Новейший графический процессор Radeon RX7900 XT имеет два ядра ускорения ИИ на каждый вычислительный блок, что обеспечивает 103 терафлопс при половинном максимальном разрешении и 52 терафлопс при одинарной пиковой точности.

В то время как серия графических процессоров Instinct лучше подходит для LLM и высокопроизводительных вычислений, ускорители Radeon AI можно использовать для настройки предварительно обученной модели, логических выводов и задач с интенсивным использованием графики.

Сравнение AMD Instinct и NVIDIA Tensor

Согласно опросу TrendForce У Nvida около 80% доли рынка серверных графических процессоров, в то время как у AMD только оставшиеся 20%. Столь ошеломляющий успех NVIDIA связан с тем, что это компания, специализирующаяся на разработке и сборке графических процессоров. Это позволяет им создавать более производительные графические процессоры, чем другие предложения.

Давайте сравним Instinct MI205X от AMD и H100SXM5 от NVIDIA, используя спецификации из Официальный сайт AMD и техническое описание NVIDIA Ее собственная:

Тип графического процессора FP64 (TFLOPS) FP32 (TFLOPS) FP16 (TFLOPS) INT8 (TFLOPS)
AMD Инстинкт MI250X 30.0 60.0 1000 2000
NVIDIA H100SXMS 47.9 95.7 383.2 383

Как видно из таблицы, AMD MI250X лучше справляется с вычислениями с двойной и половинной точностью, а NVIDIA H100SXMS намного лучше справляется с матричными вычислениями с половинной и четвертной точностью. Это делает AMD MI250X более подходящим для высокопроизводительных вычислений, а NVIDIA H100SXMS — для обучения и рассуждений ИИ. Проверять Сравнение видеокарт AMD и NVIDIA в Linux: что лучше использовать?

Будущее процессоров AMD Instinct

Хотя последнее предложение AMD, MI250X, предназначено для высокопроизводительных вычислений, грядущий MI300 больше ориентирован на обучение искусственному интеллекту. Этот AI-ускоритель заявлен как APU, объединяющий GPU и CPU в одном корпусе. Это позволяет графическому процессору MI300 использовать архитектуру APU с унифицированной памятью CNDA3, в которой графический процессор и центральный процессор будут использовать только одну память, повышая эффективность и снижая цену.

Хотя сегодня AMD не будет конкурировать с NVIDIA на рынке ускорителей ИИ, после запуска MI300 и улучшения ROCm серия AMD Instinct может быть достаточно хороша, чтобы отобрать у NVIDIA значительную часть рынка ускорителей ИИ. Вы можете просмотреть сейчас В чем разница между Nvidia GTX и Nvidia RTX?

Перейти к верхней кнопке