Нефоннеймановская архитектура, до 192 ГБ памяти и производительность в разы выше, чем у Nvidia HGX B200. Представлен необычный ИИ-ускоритель NextSilicon Maverick-2

0
2

Мы уже привыкли, что, когда речь заходит об ИИ-вычислениях, лучшими решениями являются GPU. Компания NextSilicon утверждает, что её ускоритель Maverick-2, опирающийся на нестандартную архитектуру, кладёт на лопатки не только процессоры, но и GPU. Правда, с оговорками. 

b6207a2aa8253691d44c352ce18da474 Фото NextSilicon 

Maverick-2, построенный на вычислительной архитектуре NextSilicon (ICATM), использует новую аппаратную архитектуру управления потоками данных, которая устраняет фундаментальные недостатки трёх традиционных подходов: вычислений на основе CPU, GPU и ASIC.  

Разработчик утверждает, что производительность его детища до 10 раз выше, чем у ведущих графических процессоров, при снижении энергопотребления до 60% — и всё это с использованием немодифицированного, готового кода. 

92b5463cfd02670f05b0df7b1963e2e5 Фото NextSilicon 

В отличие от центральных и графических процессоров, наша архитектура потоков данных, не основанная на фон-неймановском принципе, полностью устраняет накладные расходы на обработку инструкций и узкие места в памяти. Доступность данных определяет вычисления, а не наоборот. Мы также изменили соотношение распределения памяти на кристалле, выделив большую часть аппаратного пространства для вычислений, а не для управления. 

Согласно внутренним тестам самой NextSilicon, Maverick-2 обеспечивает до четырёх раз более высокую производительность (FP64) на ватт, чем HGX B200, и более чем в 20 раз более высокую эффективность, чем Intel Xeon Sapphire Rapids. В тестах GUPS новинка показывает результат в 32,6 GUPS при 460 Вт, что в 22 раза быстрее, чем CPU и в шесть раз быстрее, чем GPU. В рабочих нагрузках ускоритель NextSilicon достиг 600 GFLOPS при 750 Вт, потребляя при этом примерно половину мощности конкурирующих решений.  

Правда, как мы знаем, современные ИИ-вычисления в основном опираются на формат FP4/FP8, а тут у нас данных нет. 

Maverick-2 доступен в двух версиях. Базовая имеет 96 ГБ памяти HBM3E и потребляет до 400 Вт, тогда как Maverick-2 OAM располагает двумя вычислительными кристаллами, 192 ГБ памяти, но и потребляет уже 750 Вт. 

По материалам iXBT.com