Консоли

«Сбер» выложил в открытый доступ русскоязычную ИИ-модель ruGPT-3.5

20 июля

Инженеры «Сбера» выложили в открытый доступ нейросетевую модель ruGPT-3.5, лежащую в основе сервиса GigaChat, который до сих пор проходит стадию закрытого тестирования. Лицензия MIT позволяет использовать материалы проекта в коммерческих целях.

Структура датасета ruGPT-3.5. Источник изображения: habr.com

Важнейшим недостатком открытых больших языковых моделей вроде Meta* LlaMA является ограниченная поддержка русского языка — обычно это русский раздел «Википедии» и некоторое количество общедоступных текстов. Это оказывает негативное влияние на понимание моделью языка и качество её ответов. Модель ruGPT-3.5, основанная на архитектуре OpenAI GPT-3, создана в первую очередь для работы в русскоязычной среде, поэтому она более качественно обрабатывает такие запросы.

Обучение модели производилось в два этапа. Первый этап продлился 1,5 месяца — за это время платформа обработала 300 Гбайт данных: книги, энциклопедийные и научные статьи, социальные ресурсы и другие источники. Потребовались ресурсы 512 ускорителей NVIDIA V100. На втором этапе проводилось дообучение на 110 Гбайт данных из датасета The Stack, юридических документов и обновлённых текстов «Википедии» — это заняло три недели и потребовало 200 ускорителей NVIDIA A100.

В результате у ruGPT-3.5 13 млрд параметров при длине контекста 2048 токенов — для сравнения, привели пример разработчики, рассказ А. П. Чехова «Хамелеон» разбивается на 1650 токенов при его длине в 901 слово.

* Внесена в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности».

Источник: 3Dnews.ru

«Сбербанк» сократил 20 % сотрудников из-за ИИ, который «поменяет всё и везде»

9000 мА·ч, 165 Гц, Snapdragon 8 Elite Gen5, 24 ГБ ОЗУ…

Команда из 16 ИИ-агентов Anthropic Claude смогла самостоятельно написать компилятор языка…

Почти 15 000 мАч и 12/256 ГБ памяти при цене 385…

Амбициозный симулятор выживания Blackfrost: The Long Dark 2 не выйдет в…

Календарь релизов 9–15 февраля: Reanimal, Mewgenics, Romeo is a Dead Man…

«То есть Concord вас ничему не научила?»: Sony анонсировала кооперативный боевик…

К созданию Heroes of Might & Magic: Olden Era присоединился «отец»…

Ubisoft отменила ремейк Prince of Persia: The Sands of Time спустя…

AMD за один квартал разом отъела у Intel огромную долю рынка….

За девять лет Intel нарастила производительность своих iGPU в 12 раз

Intel отказалась от программы платной разблокировки функций для своих процессоров. Software…

Nvidia готовит к выходу RTX 5090 Ti? Модель мощнее RTX 5090…

С этими процессорами портативные Windows-консоли наконец-то станут по-настоящему игровыми. CPU Intel…

«Мыльницы» воскресли: продажи компактных камер внезапно взлетели почти на 30 %…

Canon выпустила юбилейную «мыльницу» по цене «зеркалки» — PowerShot G7 X Mark III…

DJI представила лёгкий стабилизатор RS 5 для камер весом до трёх…

Samsung представила первый в мире дисплей на цветных электронных чернилах E-Ink…

Владельцы Leica ищут возможность продать компанию за €1 млрд

Перечислены новые функции iPhone

РКН перешёл к полной блокировке YouTube спустя 1,5 года «замедления» —…

Легендарный телефон Nokia воскресили

Мощность конкурента iPhone 17 от Samsung оценили

Названы самые ожидаемые смартфоны

Джефф Безос намекнул Илону Маску, что его компания Blue Origin опередит…

Xbox нового поколения будет работать на Windows — подробности о самом…

Team Cherry прокачала Hollow Knight для Switch 2, PS5, Xbox Series…

Не только Ryzen 9000X3D: платы ASRock начали убивать процессоры Ryzen 5…

Xiaomi представила смартфон Redmi Turbo 5 Max с батареей на 9000…

«Сбер» выложил в открытый доступ русскоязычную ИИ-модель ruGPT-3.5

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Рубрики

Новости Hi-Tech

Джефф Безос намекнул Илону Маску, что его компания Blue Origin опередит SpaceX в новой...

«Мыльницы» воскресли: продажи компактных камер внезапно взлетели почти на 30 % — и вот...

Canon выпустила юбилейную «мыльницу» по цене «зеркалки» — PowerShot G7 X Mark III Anniversary Edition

Амбициозный симулятор выживания Blackfrost: The Long Dark 2 не выйдет в 2026 году —...

AMD за один квартал разом отъела у Intel огромную долю рынка. Компания нарастила позиции...

Джефф Безос намекнул Илону Маску, что его компания Blue Origin опередит...