Консоли

ChatGPT отучили раскрывать свои обучающие данные в ответ на просьбу вечно повторять одно слово

5 декабря

Просьба к ИИ-боту ChatGPT компании OpenAI повторять определённые слова «вечно» теперь помечается как нарушение условий предоставления услуг и политики в отношении контента чат-бота. Ранее стало известно, что таким незамысловатым способом можно извлекать огромные количества данных, на которых обучался чат-бот.

Источник изображения: Rolf van Root/unsplash.com

Исследователи подразделения Google DeepMind и ряда университетов предложили ChatGPT 3.5-turbo повторять определённые слова «вечно». После определённого количества повторений слова, бот начинал выдавать огромные объёмы обучающих данных, взятых из интернета. Используя этот метод, исследователи смогли извлечь несколько мегабайт обучающих данных и обнаружили, что в ChatGPT включены большие объёмы личных данных, которые иногда могут быть возвращены пользователям в качестве ответов на их запросы. Как сообщил ранее ресурс arXiv, с помощью повторения слова «стихотворение» (poem), учёные добились получения от ChatGPT контактных данных реального человека, включая номер телефона и адрес электронной почты.

Источник изображений: 404 Media

А при просьбе к ChatGPT повторить слово «книга», он сначала повторял его несколько раз, а затем начинал выдавать случайный контент. Часть его была взята непосредственно с сайтов CNN и Goodreads, блогов WordPress, вики-сайтов Fandom, а также там были дословные выдержки из соглашений об условиях предоставления услуг, исходный код Stack Overflow, защищённые авторским правом юридические заявления об отказе от ответственности, страницы «Википедии», веб-сайт оптовой торговли казино, новостные блоги, случайные комментарии в интернете и многое другое.

«Мы показываем, что злоумышленник может извлекать гигабайты обучающих данных из языковых моделей с открытым исходным кодом, таких как Pythia или GPT-Neo, полуоткрытых моделей, таких как LLaMA или Falcon, и закрытых моделей, таких как ChatGPT», — отметили исследователи из Google DeepMind. Они сообщили, что 30 августа известили OpenAI об уязвимости и что компания её исправила. И лишь после этого исследователи сочли возможным поделиться информацией об уязвимости чат-бота с общественностью.

Как рассказал ресурс 404 Media, теперь в ответ на просьбу к ChatGPT 3.5 «вечно» повторять слово «компьютер», бот несколько десятков раз выдаёт слово «компьютер», а затем отображает сообщение об ошибке: «Этот контент может нарушать нашу политику в отношении контента или условия использования. Если вы считаете, что это ошибка, отправьте свой отзыв — ваш вклад поможет нашим исследованиям в этой области».

Источник: 3Dnews.ru

В России резко выросло число новых IT-компаний — программисты всё чаще уходят…

OnePlus начал спешно сворачивать деятельность в США и Европе, а Realme уйдёт…

Энтузиаст превратил игры из Steam в настоящие картриджи — с помощью старых…

Домашний интернет в России дорожает всё быстрее — и это ещё…

Аналитики: за первую неделю предзаказов GTA VI заработала более четверти миллиарда…

Безумный платформер про неподвластный гравитации поезд Denshattack! на релизе порадовал игроков…

Следующая большая игра FromSoftware скоро выйдет из тени — объявлены точные…

Вампирская ролевая игра The Blood of Dawnwalker от ведущих разработчиков The…

Разработчик Warhammer 40,000: Space Marine 3 и Jurassic Park: Survival доверил…

Не новое слово на рынке, но прорыв для Windows on Arm….

10 лет назад Nvidia представила одну из своих самых успешных графических…

Через семь дней Илон Маск представит один из самых амбициозных проектов…

Nvidia пообещала новые игровые видеокарты с трассировкой пути в миллион раз…

Зафиксирована первая «смерть» Ryzen 7 9850X3D. Процессор вышел из строя через…

Fujifilm выпустила одноразовые плёночные камеры QuickSnap — они позволят снять 27…

Leica выпустила 44-Мп полнокадровую камеру SL3-P за $6690 — она займёт…

Зум-камеры в смартфонах начнут снимать чётче — представлен сенсор Sony LYTIA 610…

Представлен Sony LYTIA L910 — первый мобильный сенсор на архитектуре LOFIC

DJI представила карманную камеру Osmo Pocket 4P с двумя объективами, «киношными»…

Описаны ведущие к поломке складного смартфона привычки

GPT-5.6 Sol за час доказала математическую гипотезу, над которой учёные бились…

«Только костыли, только мучение»: в России перестали работать Diablo IV, World…

VK продаст RuStore гендиректору его разработчика

Спутниковая антенна Starlink V5 оказалась легче и компактнее модели предыдущего поколения

В России резко выросло число новых IT-компаний — программисты всё чаще уходят…

OnePlus начал спешно сворачивать деятельность в США и Европе, а Realme уйдёт…

Энтузиаст превратил игры из Steam в настоящие картриджи — с помощью старых…

Вампирская ролевая игра The Blood of Dawnwalker от ведущих разработчиков The…

Домашний интернет в России дорожает всё быстрее — и это ещё…

ChatGPT отучили раскрывать свои обучающие данные в ответ на просьбу вечно повторять одно слово

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Рубрики

Новости Hi-Tech

Описаны ведущие к поломке складного смартфона привычки

GPT-5.6 Sol за час доказала математическую гипотезу, над которой учёные бились более 50 лет

Аналитики: за первую неделю предзаказов GTA VI заработала более четверти миллиарда долларов

В России резко выросло число новых IT-компаний — программисты всё чаще уходят в аутсорс

В России резко выросло число новых IT-компаний — программисты всё чаще уходят в аутсорс

Описаны ведущие к поломке складного смартфона привычки