Последняя версия чат-бота DeepSeek настолько хороша, потому что обучалась на ускорителях Nvidia Blackwell, несмотря на запрет их поставок в Китай

0
0

Китайский чат-бот DeepSeek, как сообщается, продолжает обучаться на ускорителях Nvidia, а не китайских аналогах. Компания в обход всех запретов закупила около 2000 ускорителей актуального поколения Blackwell. 

Когда именно это произошло, не уточняется, но, судя по всему, последняя версия этой языковой модели обучалась уже на этих ускорителях. Возможно, отчасти это объясняет заметный скачок в возможностях DeepSeek последней версии. 

45d6a33c5a4c5f3c54eb8ca868be8479 Создано Gemini

До этого компания столкнулась с задержкой при обучении своей предыдущей модели, что было связано с недостатком чипов Huawei Ascend. Недостаток этот, в свою очередь, обусловлен в том числе недостаточным показателем выхода годных кристаллов у SMIC. 

Напомним, Nvidia уже работает над технологией, которая позволит отслеживать ускорители для ИИ с достаточно высокой точностью.  

По материалам iXBT.com