Nvidia представила чудовищный GPU с 208 млрд транзисторов, но не для геймеров. Это графический процессор Blackwell для ИИ

0
0

Как и предполагалось на днях, сегодня на мероприятии GTC 2024 компания Nvidia представила свой новый GPU — первый из поколения Blackwell. 

8ae1d0c1cf8b7563b80b6743ed84c691

На этом графическом процессоре будут построены ускорители для ИИ нового поколения. Анонс довольно объёмный, хотя Nvidia раскрыла пока не всю информацию. В частности, нет даже внятно указанного имени. В основном компания говорит о GPU Blackwell, а на сайте можно найти разные варианты, но они, видимо, относятся к не графическому ядру, а к готовым решениям, которые Nvidia порой тоже называет GPU, хотя это полноценный ускоритель.  

a09c29563109557ec5c0212e41891508

Начать стоит с того, что GPU Blackwell представляет собой гигантский графический процессор. Он содержит 208 млрд транзисторов. Для сравнения, GH100 имеет 80 млрд транзисторов. Вторая особенность заключается в том, что GPU Blackwell — это первый многочиповый GPU Nvidia. Он состоит из двух одинаковых кристаллов, да ещё и окружённых микросхемами памяти. Между собой кристаллы соединены шиной NV-High Bandwidth (NV-HBI) с пропускной способностью в 10 ТБ/с. Количество ядер CUDA или каких-либо иных вычислительных блоков пока не раскрывается, но, учитывая гигантский скачок в количестве транзисторов, вполне логично ожидать и огромный прирост количества вычислительных блоков.  

Вокруг GPU размещены восемь стеков памяти HBM3e суммарным объёмом 192 ГБ с 8192-битной шиной и пропускной способностью в невероятные 8 ТБ/с. 

Производится всё это по техпроцессу 4 нм, а не 3 нм, как предполагалось, но это обновлённый техпроцесс TSMC 4NP.  

419ddec8a3af7e8a2c81f8ff4ed92c25

Сама Nvidia, сравнивая GPU Blackwell с GH100, говорит о том, что новое решение быстрее старого в 2,5-5 раз в зависимости от режима. Что интересно, производительность в режиме FP32 вообще не указана, хотя из-за акцента на вычисления ИИ это может быть не так и важно. 

На самом деле параметры нового GPU, кроме прочего, хорошо показывают, куда Nvidia сейчас вкладывает все силы. Если посмотреть на историю игровых графических процессоров компании, такого гигантского скачка за одно поколения, похоже, никогда не было. Учитывая ажиотаж вокруг ИИ и позиции Nvidia на этом рынке, ничего удивительного в такой ставке нет — этот рынок приносит компании огромные деньги. 

Также Nvidia сразу рассказала об ускорителе GB200 Grace Blackwell Superchip, который будет содержать два GPU нового поколения и процессор с 72 ядрами Arm Neoverse V2. Производительность такого монстра в режиме FP4 составит невероятные 40 PFLOPS.  

По материалам iXBT.com