Консоли

Появился сетевой червь, работающий через сервисы ИИ — он размножается, рассылает спам и похищает данные

3 марта

Международная группа исследователей в области кибербезопасности разработала червя, способного самостоятельно распространяться между сервисами генеративного искусственного интеллекта, похищать данные и рассылать спам по электронной почте.

Источник изображения: Growtika / unsplash.com

По мере развития систем генеративного ИИ, таких как OpenAI ChatGPT и Google Gemini, они всё чаще используются для решения конкретных задач, например, создания событий в календарях или заказа продуктов. Исследователи технологий кибербезопасности, однако, решили продемонстрировать, что подобные системы могут нести угрозу — они создали новый вид атак, которого прежде не существовало в принципе. Учёные разработали червя, получившего название Morris II в честь первого компьютерного червя Morris, который в 1988 году заразил 6200 компьютеров — 10 % всех компьютеров, на тот момент подключённых к интернету. Morris II через электронную почту разворачивает атаку на виртуальных помощников, основанных на генеративном ИИ, производит кражу данных из электронных писем и рассылает спам, минуя средства защиты ChatGPT и Gemini.

Авторы исследования испытали новую модель атаки в изолированных средах — она оказалась возможной из-за мультимодального характера больших языковых моделей, то есть их способности работать с текстом, изображениями и видео. Атакующие генеративный ИИ черви ещё не были обнаружены на практике, но исследователи предупреждают, что эту угрозу следует принимать в расчёт и одиночным разработчикам, и стартапам, и технологическим компаниям.

Большинство систем генеративного ИИ работает, получая текстовые команды — просьбы ответить на вопрос или создать изображение. Эти команды можно использовать против системы, заставив её проигнорировать меры безопасности и выдать недопустимый контент; ей можно дать неявные инструкции, например, предложив ей адрес вредоносной страницы со скрытым текстом таких команд. Принцип работы атакующего генеративный ИИ червя состоит в механизме «состязательной самовоспроизводящейся команды» (adversarial self-replicating prompt). Такая команда заставляет модель генеративного ИИ выдавать в ответе ещё одну команду. Это во многом напоминает традиционные схемы атак вроде SQL-инъекций и переполнения буфера.

Чтобы продемонстрировать работу червя, исследователи создали службу электронной почты, способную получать и отправлять сообщения с помощью генеративного ИИ — для этого она подключается к ChatGPT, Gemini и открытой модели LlaVA. Затем они применили два способа эксплуатации уязвимости ИИ: при помощи самовоспроизводящейся текстовой инструкции и аналогичной инструкции, встроенной в файл изображения.

Осуществляя тестовую атаку, исследователи подготовили электронное письмо с вредоносной командой на генерацию ответа с использованием поиска в интернете, при котором большая языковая модель обращается за дополнительной информацией в Сеть. Получив такое письмо, служба для генерации ответа направляет запрос в GPT-4 или Gemini Pro — этот запрос производит «взлом генеративного ИИ» и осуществляет кражу данных из электронных писем. Ответ ИИ, содержащий конфиденциальные данные пользователя, далее сам при ответе на электронное письмо заражает новые хосты и сохраняется в базе нового клиента. Во втором примере такой командой стал файл изображения: заложив в файл картинки команду на самовоспроизводство, можно одной отправкой электронного письма спровоцировать дальнейшую массовую рассылку изображения любого содержания, включая оскорбительные или экстремистские материалы. Исследователи утверждают, что таким способом можно извлекать данные электронных писем, в том числе номера телефонов, кредитных карт, номеров социального страхования — любую конфиденциальную информацию.

Авторы исследования отмечают, что эти методы атак оказались возможными из-за ошибок при проектировании архитектуры в экосистеме ИИ. Они поделились своим открытием с Google и OpenAI — в OpenAI подтвердили наличие угрозы, но добавили, что компания работает над повышением устойчивости своих систем, а в Google от комментариев отказались. Чтобы защититься от подобных атак, эксперты предлагают не только повысить надёжность систем, но и изменить модель их эксплуатации: пользователям не следует предоставлять ИИ привилегий, таких как возможность отправки электронной почты от их имени — все действия система должна согласовывать с человеком. Кроме того, многократное повторение одной и той же команды ИИ в системе вызовет подозрение у защитных механизмов. Тем не менее, исследователи считают, что атакующие генеративный ИИ черви начнут работать в ближайшие два или три года.

Источник: 3Dnews.ru

В России резко выросло число новых IT-компаний — программисты всё чаще уходят…

OnePlus начал спешно сворачивать деятельность в США и Европе, а Realme уйдёт…

Энтузиаст превратил игры из Steam в настоящие картриджи — с помощью старых…

Домашний интернет в России дорожает всё быстрее — и это ещё…

Безумный платформер про неподвластный гравитации поезд Denshattack! на релизе порадовал игроков…

Следующая большая игра FromSoftware скоро выйдет из тени — объявлены точные…

Вампирская ролевая игра The Blood of Dawnwalker от ведущих разработчиков The…

Разработчик Warhammer 40,000: Space Marine 3 и Jurassic Park: Survival доверил…

Разработчик Warhammer 40,000: Space Marine 3 и Jurassic Park: Survival доверил…

Не новое слово на рынке, но прорыв для Windows on Arm….

10 лет назад Nvidia представила одну из своих самых успешных графических…

Через семь дней Илон Маск представит один из самых амбициозных проектов…

Nvidia пообещала новые игровые видеокарты с трассировкой пути в миллион раз…

Зафиксирована первая «смерть» Ryzen 7 9850X3D. Процессор вышел из строя через…

Fujifilm выпустила одноразовые плёночные камеры QuickSnap — они позволят снять 27…

Leica выпустила 44-Мп полнокадровую камеру SL3-P за $6690 — она займёт…

Зум-камеры в смартфонах начнут снимать чётче — представлен сенсор Sony LYTIA 610…

Представлен Sony LYTIA L910 — первый мобильный сенсор на архитектуре LOFIC

DJI представила карманную камеру Osmo Pocket 4P с двумя объективами, «киношными»…

«Только костыли, только мучение»: в России перестали работать Diablo IV, World…

VK продаст RuStore гендиректору его разработчика

Спутниковая антенна Starlink V5 оказалась легче и компактнее модели предыдущего поколения

Инфляция в России резко замедлилась

SpaceX выполнила 600-й повторный запуск первой ступени Falcon 9 в космос

В России резко выросло число новых IT-компаний — программисты всё чаще уходят…

OnePlus начал спешно сворачивать деятельность в США и Европе, а Realme уйдёт…

Энтузиаст превратил игры из Steam в настоящие картриджи — с помощью старых…

Вампирская ролевая игра The Blood of Dawnwalker от ведущих разработчиков The…

Домашний интернет в России дорожает всё быстрее — и это ещё…

Появился сетевой червь, работающий через сервисы ИИ — он размножается, рассылает спам и похищает данные

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Рубрики

Новости Hi-Tech

В России резко выросло число новых IT-компаний — программисты всё чаще уходят в аутсорс

В России резко выросло число новых IT-компаний — программисты всё чаще уходят в аутсорс

«Только костыли, только мучение»: в России перестали работать Diablo IV, World of Warcraft и...

OnePlus начал спешно сворачивать деятельность в США и Европе, а Realme уйдёт из Китая

OnePlus начал спешно сворачивать деятельность в США и Европе, а Realme уйдёт из Китая

В России резко выросло число новых IT-компаний — программисты всё чаще уходят...