Софт

Языковые модели ИИ сразились друг с другом в импровизированном турнире по Street Fighter III

7 апреля

На хакатоне Mistral AI, прошедшем в Сан-Франциско на минувшей неделе, разработчики Стэн Жирар (Stan Girard) и Quivr Brain представили тест LLM Colosseum с открытым исходным кодом, основанный на классическом аркадном файтинге Street Fighter III. Тест предназначен для определения самой эффективной языковой модели ИИ в не совсем традиционной, но зрелищной манере.

Источник изображений: YouTube / Matthew Berman

ИИ-энтузиаст Мэтью Берман (Matthew Berman) решил провести с помощь теста LLM Colosseum своеобразный турнир между языковыми моделями, о чём он поделился в своём видео. В нём же Берман показал один из поединков между ИИ. Кроме того, он рассказал, как можно установить этот проект с исходным кодом на домашний ПК или Mac и оценить его самостоятельно.

Это не совсем типичный тест LLM. Как правило, маленькие языковые модели имеют преимущество в задержке и скорости, что приводит к победе в большинстве виртуальных боёв. В файтингах очень важна скорость реакции игроков на ответные действия своих оппонентов. То же правило работает и в случае противостояния ИИ против ИИ.

Источник изображений: OpenGenerativeAI team

Языковая модель в реальном времени принимает решение, как ей сражаться. Поскольку LLM представляют собой текстовые модели, их обучили в игре Street Fighter III с помощью текстовых подсказок. ИИ сначала дали проанализировать контекст игры в целом, а затем подсказали, как реагировать на то или иное игровое действие в той или иной ситуации, не забыв про вариативность ходов. ИИ обучили приближаться или отдаляться от противника, а также использовать различные приёмы вроде огненного шара, мегаудара, урагана и мегаогненного шара.

Источник изображения: OpenGenerativeAI team

Продемонстрированный на видео бой между ИИ выглядит динамично. Оппоненты действуют стратегически, блокируют удары противника и используют специальные приёмы. Однако к настоящему моменту проект LLM Colosseum позволяет использовать только одного игрового персонажа, Кена.

Согласно тестам Жирара, лучшей языковой моделью в турнире Street Fighter III оказалась GPT 3.5 Turbo от OpenAI. Среди восьми участников она достигла самого высокого рейтинга ELO — 1776.

В отдельной серии тестов, организованных Банджо Обайоми (Banjo Obayomi), специалистом по продвижению продуктов AWS компании Amazon, спарринги проводились между четырнадцатью языковыми моделями в рамках 314 индивидуальных матчей. Здесь в конечном итоге победила языковая модель claude_3_haiku от Anthropic с рейтингом ELO 1613.

Источник: 3Dnews.ru

«Сбербанк» сократил 20 % сотрудников из-за ИИ, который «поменяет всё и везде»

9000 мА·ч, 165 Гц, Snapdragon 8 Elite Gen5, 24 ГБ ОЗУ…

Команда из 16 ИИ-агентов Anthropic Claude смогла самостоятельно написать компилятор языка…

Почти 15 000 мАч и 12/256 ГБ памяти при цене 385…

Амбициозный симулятор выживания Blackfrost: The Long Dark 2 не выйдет в…

Календарь релизов 9–15 февраля: Reanimal, Mewgenics, Romeo is a Dead Man…

«То есть Concord вас ничему не научила?»: Sony анонсировала кооперативный боевик…

К созданию Heroes of Might & Magic: Olden Era присоединился «отец»…

Ubisoft отменила ремейк Prince of Persia: The Sands of Time спустя…

AMD за один квартал разом отъела у Intel огромную долю рынка….

За девять лет Intel нарастила производительность своих iGPU в 12 раз

Intel отказалась от программы платной разблокировки функций для своих процессоров. Software…

Nvidia готовит к выходу RTX 5090 Ti? Модель мощнее RTX 5090…

С этими процессорами портативные Windows-консоли наконец-то станут по-настоящему игровыми. CPU Intel…

«Мыльницы» воскресли: продажи компактных камер внезапно взлетели почти на 30 %…

Canon выпустила юбилейную «мыльницу» по цене «зеркалки» — PowerShot G7 X Mark III…

DJI представила лёгкий стабилизатор RS 5 для камер весом до трёх…

Samsung представила первый в мире дисплей на цветных электронных чернилах E-Ink…

Владельцы Leica ищут возможность продать компанию за €1 млрд

Перечислены новые функции iPhone

РКН перешёл к полной блокировке YouTube спустя 1,5 года «замедления» —…

Легендарный телефон Nokia воскресили

Мощность конкурента iPhone 17 от Samsung оценили

Названы самые ожидаемые смартфоны

Джефф Безос намекнул Илону Маску, что его компания Blue Origin опередит…

Xbox нового поколения будет работать на Windows — подробности о самом…

Team Cherry прокачала Hollow Knight для Switch 2, PS5, Xbox Series…

Не только Ryzen 9000X3D: платы ASRock начали убивать процессоры Ryzen 5…

Xiaomi представила смартфон Redmi Turbo 5 Max с батареей на 9000…

Языковые модели ИИ сразились друг с другом в импровизированном турнире по Street Fighter III

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Рубрики

Новости Hi-Tech

Джефф Безос намекнул Илону Маску, что его компания Blue Origin опередит SpaceX в новой...

«Мыльницы» воскресли: продажи компактных камер внезапно взлетели почти на 30 % — и вот...

Canon выпустила юбилейную «мыльницу» по цене «зеркалки» — PowerShot G7 X Mark III Anniversary Edition

Амбициозный симулятор выживания Blackfrost: The Long Dark 2 не выйдет в 2026 году —...

AMD за один квартал разом отъела у Intel огромную долю рынка. Компания нарастила позиции...

Джефф Безос намекнул Илону Маску, что его компания Blue Origin опередит...