Развитие сферы высокопроизводительных вычислений в наши дни стало зависеть от способности разработчиков специализированных ускорителей использовать самую скоростную из доступных на рынке разновидностей памяти. По некоторым данным, SK hynix и NVIDIA уже работают над интеграцией микросхем HBM4 прямо на графический процессор.
Конечно, «графическим» такой процессор принято называть чисто по инерции, поскольку NVIDIA уже давно обособила линейки своей продукции для ускорения вычислений и работы с графикой. Использование памяти типа HBM стало атрибутом первого типа продукции NVIDIA. В случае с актуальным ассортиментом ускорителей последней из марок южнокорейская SK hynix изначально была единственным поставщиком памяти типа HBM3, поскольку только её продукция отвечала строжайшим требованиям NVIDIA как с точки зрения производительности, так и возможности интеграции в процессе производства.
Сейчас микросхемы HBM3 и HBM3e соседствуют с графическим процессором на одной подложке, сама память при этом может насчитывать до 12 ярусов. Как сообщает Tom’s Hardware со ссылкой на южнокорейские СМИ, компании NVIDIA и SK hynix уже ведут разработку технологии интеграции микросхем памяти HBM4 прямо поверх кристалла графического процессора. Подобная близость двух типов этих компонентов позволит значительно повысить скорость обмена информацией, но будет предъявлять особые требования не только к производственному процессу, но и к охлаждению компонентов.
Скорее всего, SK hynix будет передавать свои микросхемы HBM4 компании TSMC, которая попутно будет производить и графические процессоры NVIDIA, а затем этот тайваньский подрядчик будет и «сращивать» эти кристаллы без использования промежуточной подложки. Отдалённо эта технология напоминает производство процессоров AMD Ryzen с памятью типа 3D V-Cache, интегрируемой прямо на кристалл с вычислительными ядрами. Просто память HBM4 окажется несколько медленнее, но дешевле используемого AMD кеша, и при этом предложить гораздо большую ёмкость. Память HBM4 должна увеличить разрядность шины памяти с 1024 до 2048 бит, что дополнительно увеличивает целесообразность отказа от промежуточной подложки, поскольку она выходила бы слишком дорогой в производстве.
Существенную проблему будет представлять охлаждение такой конструкции, поскольку графические процессоры и без памяти становятся всё более горячими, да и микросхемы HBM4 тоже придётся охлаждать интенсивно, и при этом оба типа компонентов расположатся друг на друге. Впрочем, в серверном сегменте как раз применение продвинутых методов охлаждения с использованием жидкости или погружением в диэлектрическую жидкость всего ускорителя оправдывает себя с точки зрения экономической целесообразности и сложности. Не исключено также, что микросхемы HBM4 и связанные с ними графические процессоры будут производиться если не по одному и тому же техпроцессу, то хотя бы по близким технологическим нормам. С этой точки зрения требования к производственному процессу станут почти идентичными как для логической части ускорителей, так и для памяти.
Источник: