Софт

ИИ Google теперь читает по губам лучше, чем человек

26 ноября

Исследователи из Google DeepMind и Оксфордского университета использовали искусственный интеллект для создания наиболее точного на сегодняшний день программного обеспечения для чтения по губам. Для тренировки нейронной сети учёные использовали тысячи часов записей с BBC, благодаря чему система научилась с вероятностью в 46,8 % определять то, что говорят люди на экране. Результаты могут показаться не такими уж и впечатляющими, особенно если учесть точность транскрибирования искусственным интеллектом аудиозаписей, однако профессионал в чтении по губам смог правильно определить слова в тех же видеороликах лишь в 12,4 % случаев.

Другая группа исследователей из Оксфордского университета ранее в этом месяце отчиталась о похожем проекте. Используя аналогичные технологии, они сумели создать программу LipNet, которая в тестах показала точность в 93,4 %, в то время как точность определения слов человеком составила 52,3 %. Однако программа эта тестировалась только на специально записанном для неё видео, в котором волонтёры зачитывали шаблонные фразы. В свою очередь, программное обеспечение DeepMind, называемое Watch, Listen, Attend, and Spell, транскрибировало естественные, неподготовленные диалоги из политических передач с канала BBC.

Для тренировки нейронной сети использовалось более пяти тысяч часов записей из таких телевизионных шоу, как Newsnight, Question Time и World Today. Ролики включали в себя 118 тысяч различных предложений и около 17,5 тысяч уникальных слов, в то время как в базе видеороликов для тестирования LipNet присутствовало всего 51 уникальное слово.

Исследователи из DeepMind считают, что их новая программа может быть полезна в целом ряде случаев — например, в помощи людям со слабым слухом в понимании диалогов. Она также могла бы быть использована для аннотирования немых фильмов или управления голосовыми помощниками посредством проговаривания слов на камеру.

Источник: 3Dnews.ru

На Amazon всплыло «устройство подачи пикселей» Intel Arc B580

Xiaomi 14T Pro, Xiaomi 14T и Redmi Note 13 Pro 5G…

Заждались: продажи S.T.A.L.K.E.R. 2: Heart of Chornobyl за два дня после…

У Nvidia нашлась ахиллесова пята — треть выручки зависит от настроения трёх…

Блогер показал, как пройти Baldur’s Gate 3, не делая в бою…

Valve раскрыла часть игр, которые получат скидку на осенней распродаже Steam…

Заждались: продажи S.T.A.L.K.E.R. 2: Heart of Chornobyl за два дня после…

Star Wars Outlaws вышла в Steam с крупным обновлением и дополнением…

В программу сохранения классических игр от GOG вошли S.T.A.L.K.E.R. Shadow of…

Nvidia оснастит GeForce RTX 5070 лишь 12 ГБ памяти. Зато до…

Обычно процессоры AMD дешевеют вскоре после выхода, а Ryzen 7 9800X3D…

GeForce RTX 5090 получит гигантский графический процессор. Самый большой за последние…

Как минимум в этом Intel опередит AMD и Nvidia. Intel первой…

AMD идёт против рынка и отказывается от блока NPU в своих…

Leica выпустила платиновую плёночную камеру за $23 000 к 70-летнему юбилею…

Canon EOS R6 Mark III и EOS R7 Mark II ожидаются…

Fujifilm представила беззеркалку X-M5 всего за $800 — она ориентирована на начинающих…

Raspberry Pi и Sony представили модуль ИИ-камеры для «малинки» стоимостью $70

DJI представила экшн-камеру Osmo Action 5 Pro — 40 Мп, рекордный динамический…

Tesla признана самой опасной маркой машин — в этом есть и заслуга…

Глава Samsung собрался очистить компанию от неповоротливого топ-менеджмента в сфере чипов

Microsoft открыла доступ к скандальной ИИ-функции Recall — пользователям разрешили ограничить её…

Названа главная особенность iOS 20

Apple признала устаревшим переходник для iPhone

Глава Samsung собрался очистить компанию от неповоротливого топ-менеджмента в сфере чипов

Microsoft открыла доступ к скандальной ИИ-функции Recall — пользователям разрешили ограничить её…

На Amazon всплыло «устройство подачи пикселей» Intel Arc B580

Россия и США активно обсуждают, как будут топить МКС

Представлен 80-долларовый смартфон Tecno Pop 9 — с Helio G50 и…

ИИ Google теперь читает по губам лучше, чем человек

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Глава Samsung собрался очистить компанию от неповоротливого топ-менеджмента в сфере чипов