Консоли

Первое знакомство с революционной нейросетью Google Gemini разочаровало пользователей

8 декабря

Вчера компания Google представила флагманскую большую языковую модель искусственного интеллекта (ИИ) Gemini. Нейросеть предназначена для целого ряда продуктов и сервисов, включая ИИ-чат-бота Bard, конкурента ChatGPT. Однако большинство пользователей, успевших протестировать обновлённый Bard на свежей нейросети, остались недовольны результатами.

Источник изображения: Google

В своих блогах и материалах для прессы Google превозносит превосходную архитектуру и возможности Gemini, утверждая, что данная модель соответствует или даже превосходит по производительности другие ведущие модели генеративного ИИ, такие как GPT-4 от OpenAI. Однако первый опыт взаимодействия некоторых пользователей свидетельствует об обратном.

Так, вчера Bard получил апгрейд в виде «облегчённой» версии модели под названием Gemini Pro. Пользователи сразу начали высказывать своё недовольство обновлением на страницах социальной сети X (бывший Twitter). К примеру, чат-бот не смог правильно предоставить простые факты, например, победителей премии «Оскар» 2023 года. При этом Gemini Pro неверно утверждает, что в прошлом году лучшим актёром стал Брендон Глисон (Brendan Gleeson), в то время как фактически победителем был Брендан Фрейзер (Brendan Fraser). При попытках пользователей задать этот же вопрос, можно в результате получить другой неправильный ответ.

Источник изображения: Google

Похожая ситуация с вопросами касательно лучших фильмов: «На западном фронте без перемен» стал лучшим международным фильмом по мнению модели, «Говорят женщины» стал лучшим адаптированным сценарием, а «Пиноккио» — лучшим анимационным фильмом. Модель во всех этих примерах выдала некорректные ответы.

Кроме того, Bard на базе Gemini продемонстрировал плохую производительность при переводах. К примеру, при попытках пользователей запросить у модели слово на французском языке, состоящее из 6 букв, Gemini выдаёт вариант из 7 букв.

Источник изображения: Google

А как насчёт обобщения новостей? Gemini Pro, имея в своём распоряжении «Google Поиск» и «Google Новости», очевидно, может предоставить краткий обзор новостей. Как бы не так. Похоже, Gemini Pro не желает комментировать потенциально спорные темы новостей, предлагая пользователям… погуглить самим. При этом конкурент от OpenAI ChatGPT, напротив, легко справляется с этой задачей, предоставляя краткое изложение со ссылками на новостные статьи. Хотя доступна эта функция лишь платным подписчикам — бесплатная версия ChatGPT не подключена к интернету.

Источник изображения: OpenAI

Как и все генеративные модели ИИ, Gemini Pro не застрахован от «взлома», то есть от запросов, которые обходят защитные фильтры, пытающиеся предотвратить обсуждение спорных тем. Используя автоматизированный метод алгоритмического изменения контекста подсказок до тех пор, пока защитные фильтры Gemini Pro не перестанут работать, исследователи ИИ-безопасности из стартапа Robust Intelligence, продающего инструменты для аудита моделей, смогли заставить Gemini Pro предложить способы аморальных действий, например, кражи у благотворительной организации.

Следует отметить, что Gemini Pro на текущий момент не является самой способной версией Gemini. Более продвинутая версия — Gemini Ultra — должна появиться на рынке в следующем году, в ИИ-чат-боте Bard и других продуктах. Поэтому сейчас Google сравнивает Gemini Pro с моделью конкурента GPT-3.5, которой уже около года, а не с последней версией GPT-4.

Тем не менее, Google пообещала, что Gemini Pro улучшит рассуждения, планирование и понимание по сравнению с предыдущей моделью, используемой в Bard, и заявила, что Gemini Pro лучше справляется с обобщением контента, мозговым штурмом и написанием текста. Пока что этого не видно.

Источник: 3Dnews.ru

По советам из соцсетей люди стали класть смартфоны в холодильники —…

В России резко выросло число новых IT-компаний — программисты всё чаще уходят…

OnePlus начал спешно сворачивать деятельность в США и Европе, а Realme уйдёт…

Энтузиаст превратил игры из Steam в настоящие картриджи — с помощью старых…

Первый патч для Assassin’s Creed Black Flag Resynced починил заставочные ролики…

Аналитики: за первую неделю предзаказов GTA VI заработала более четверти миллиарда…

Безумный платформер про неподвластный гравитации поезд Denshattack! на релизе порадовал игроков…

Следующая большая игра FromSoftware скоро выйдет из тени — объявлены точные…

Вампирская ролевая игра The Blood of Dawnwalker от ведущих разработчиков The…

Не новое слово на рынке, но прорыв для Windows on Arm….

10 лет назад Nvidia представила одну из своих самых успешных графических…

Через семь дней Илон Маск представит один из самых амбициозных проектов…

Nvidia пообещала новые игровые видеокарты с трассировкой пути в миллион раз…

Зафиксирована первая «смерть» Ryzen 7 9850X3D. Процессор вышел из строя через…

Fujifilm выпустила одноразовые плёночные камеры QuickSnap — они позволят снять 27…

Leica выпустила 44-Мп полнокадровую камеру SL3-P за $6690 — она займёт…

Зум-камеры в смартфонах начнут снимать чётче — представлен сенсор Sony LYTIA 610…

Представлен Sony LYTIA L910 — первый мобильный сенсор на архитектуре LOFIC

DJI представила карманную камеру Osmo Pocket 4P с двумя объективами, «киношными»…

Описаны ведущие к поломке складного смартфона привычки

GPT-5.6 Sol за час доказала математическую гипотезу, над которой учёные бились…

«Только костыли, только мучение»: в России перестали работать Diablo IV, World…

VK продаст RuStore гендиректору его разработчика

Спутниковая антенна Starlink V5 оказалась легче и компактнее модели предыдущего поколения

По советам из соцсетей люди стали класть смартфоны в холодильники —…

В России резко выросло число новых IT-компаний — программисты всё чаще уходят…

OnePlus начал спешно сворачивать деятельность в США и Европе, а Realme уйдёт…

Энтузиаст превратил игры из Steam в настоящие картриджи — с помощью старых…

Вампирская ролевая игра The Blood of Dawnwalker от ведущих разработчиков The…

Первое знакомство с революционной нейросетью Google Gemini разочаровало пользователей

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Рубрики

Новости Hi-Tech

Первый патч для Assassin’s Creed Black Flag Resynced починил заставочные ролики на ПК, а...

По советам из соцсетей люди стали класть смартфоны в холодильники — а после массово...

По советам из соцсетей люди стали класть смартфоны в холодильники — а после массово...

Описаны ведущие к поломке складного смартфона привычки

GPT-5.6 Sol за час доказала математическую гипотезу, над которой учёные бились более 50 лет

Первый патч для Assassin’s Creed Black Flag Resynced починил заставочные ролики...