Консоли

OpenAI остаётся только завидовать — обучение китайской модели ИИ DeepSeek R1 обошлось всего в $294 тыс.

19 сентября

Китайская компания DeepSeek сообщила, что на обучение её модели искусственного интеллекта R1 было затрачено $294 тыс., что радикально меньше, чем аналогичные расходы американских конкурентов. Эта информация была опубликована в академическом журнале Nature. Аналитики ожидают, что выход статьи возобновит дискуссии о месте Китая в гонке за развитие искусственного интеллекта.

Обзор ноутбука HONOR MagicBook Pro 16 HUNTER 2025. Для игр? Для работы? Для игр и работы!
Обзор планшета HUAWEI MatePad 11,5» (2025): апгрейд без бликов
Обзор смартфона HUAWEI Pura 80 Pro: разумный флагман с мощнейшей камерой
Ноутбуки HONOR MagicBook: технологии, дизайн и производительность для любых задач
В чем уникальность зум-камеры HUAWEI Pura 80 Ultra?
Компьютер месяца — сентябрь 2025 года
Обзор видеокарты Acer Nitro Intel Arc B580 OC
Шестиядерники за 10 тысяч рублей — сравнение и тесты

Источник изображения: DeepSeek

Выпуск компанией DeepSeek в январе сравнительно дешёвых систем ИИ побудил мировых инвесторов избавляться от акций технологических компаний из опасения обвала их стоимости. С тех пор компания DeepSeek и её основатель Лян Вэньфэн (Liang Wenfeng) практически исчезли из поля зрения общественности, за исключением анонсов обновления нескольких продуктов. Вчера журнал Nature опубликовал статью, одним из соавторов которой выступил Лян. Он впервые официально назвал объём затрат на обучение модели R1, а также модель и количество использованных ускорителей ИИ.

Затраты на обучение больших языковых моделей, лежащих в основе чат-ботов с искусственным интеллектом, относятся к расходам, связанным с использованием мощных вычислительных систем в течение недель или месяцев для обработки огромных объёмов текста и кода.

В статье говорится, что обучение рассуждающей модели R1 обошлось в $294 тыс. долларов и потребовало 512 ускорителей Nvidia H800. Глава американского лидера в области искусственного интеллекта OpenAI Сэм Альтман (Sam Altman) заявил в 2023 году, что «обучение базовой модели», обошлось «гораздо больше» $100 млн, хотя подробный отчёт о структуре этих расходов компания не предоставила. Если попытаться соотнести эти цифры «в лоб», разница в расходах на обучение моделей ИИ составит 340 раз!

Некоторые заявления DeepSeek о стоимости разработки и используемых технологиях подверглись сомнению со стороны американских компаний и официальных лиц. Ускорители H800 были разработаны Nvidia для китайского рынка после того, как в октябре 2022 года США запретили компании экспортировать в Китай более мощные решения H100 и A100. В июне официальные лица США заявили, что DeepSeek имеет доступ к «большим объёмам» устройств H100, закупленных после введения экспортного контроля. Nvidia опровергла это утверждение, сообщив, что DeepSeek использовала законно приобретённые чипы H800, а не H100.

Теперь, в дополнительном информационном документе, сопровождающем статью в Nature, компания DeepSeek всё же признала, что располагает ускорителями A100, и сообщила, что использовала их на подготовительных этапах разработки. «Что касается нашего исследования DeepSeek-R1, мы использовали графические процессоры A100 для подготовки к экспериментам с меньшей моделью», — написали исследователи. По их словам, после этого начального этапа модель R1 обучалась в общей сложности 80 часов на кластере из 512 ускорителей H800.

Ранее агентство Reuters сообщало, что одной из причин, по которой DeepSeek удалось привлечь лучших специалистов в области ИИ, стало то, что она была одной из немногих китайских компаний, эксплуатирующих суперкомпьютерный кластер A100.

Источник: 3Dnews.ru

Это планшеты с экранами E Ink и частотой 50 Гц. Представлены…

Nintendo выиграла суд против стримера пиратских игр для Switch, вручив ему…

Snapdragon 8 Elite Gen 5 и 8,8-дюймовый экран: характеристики планшета Lenovo…

Настольные суперкомпьютеры Nvidia DGX Spark получили скоростные SSD от Samsung

Календарь релизов 3 – 9 ноября: Europa Universalis V, Syberia Remastered,…

Разработчиков GTA VI обвинили в «одном из самых вопиющих и безжалостных…

«Самый важный и значимый момент в жизни»: Escape from Tarkov ушла…

Первое дополнение к Frostpunk 2 не заставит себя долго ждать —…

Журналисты выяснили, кто снимет и напишет фильм по Call of Duty…

Популярные игровые процессоры Ryzen X3D основаны на украденных технологиях? Adeia обвинила…

Трамп: Китай и другие страны не смогут получить топовые процессоры Nvidia

«AI8 будет просто неземным». Илон Маск подтвердил создание сразу четырёх поколений…

Вода с автомобильным антифризом, и новый рекорд готов. Гликолевая смесь помогла…

Nvidia пока остаётся с нулём. Дональд Трамп вообще не обсуждал поставки…

«Все равны перед объективом — и за ним»: Lomography представила функциональную…

Легендарная Vertu представила смартфон Agent Q, который можно купить только в…

Kohler представил умную камеру для унитаза за $599, которая следит за…

Fujifilm представила гибридную камеру Instax LiPlay Plus — с записью звука,…

Samsung представила уменьшенный 200-Мп сенсор ISOCELL HP5 и хвастается его главным недостатком

В России предложили ввести зарплату для занимающегося воспитанием детей родителя

Samsung представила смартфон с тройным экраном

Стало известно о втором случае плавления коннектора 12V-2×6 у Sapphire Radeon…

Samsung не смогла обновить свои смартфоны

Китайская Orico выпустила копии Mac Pro и Mac Mini на процессорах…

Nintendo выиграла суд против стримера пиратских игр для Switch, вручив ему…

Мировой рекорд разгона памяти DDR5 обновлён до 13 034 МГц

Стоимость подписки «Яндекс Плюс» увеличится с 1 декабря

ChatGPT перестал давать медицинские и юридические консультации — для блага пользователей

С YouTube начали загадочно пропадать технические обучающие ролики — ИИ якобы…

OpenAI остаётся только завидовать — обучение китайской модели ИИ DeepSeek R1 обошлось всего в $294 тыс.

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Это планшеты с экранами E Ink и частотой 50 Гц. Представлены...