Консоли

GPT-5 взломали всего за 24 часа — ИИ выдал рецепты запрещённых веществ быстрее, чем GPT-4o

11 августа

Две независимые исследовательские компании протестировали только что выпущенную нейросеть GPT-5 и выявили критические уязвимости в её системе безопасности. NeuralTrust удалось взломать модель за один день, заставив её сгенерировать инструкцию по изготовлению зажигательной смеси в кустарных условиях. Компания SPLX, в свою очередь, обнаружила уязвимости к атакам с применением обфускации запросов.

HUAWEI Pura 80 Ultra глазами фотографа
Обзор смартфона HUAWEI Pura 80 Ultra: зум, которому нет равных
Первый взгляд на смартфон HUAWEI Pura 80 Ultra
Пять причин полюбить HONOR 400
Обзор смартфона HONOR 400: реаниматор
HUAWEI nova Y73: самый недорогой смартфон с кремний-углеродной батареей
Обзор HUAWEI MatePad Pro 12.2’’ (2025): обновление планшета с лучшим экраном
Обзор смартфона HUAWEI nova Y63: еще раз в ту же реку
Обзор ноутбука HONOR MagicBook Pro 14 (FMB-P) на платформе Core Ultra второго поколения
Пять причин полюбить ноутбук HONOR MagicBook Pro 14

Источник изображения: Viralyft/Unsplash

После того, как Grok-4 был взломан за два дня, GPT-5 был взломан теми же исследователями всего за 24 часа. Специалисты NeuralTrust использовали комбинацию собственной методики EchoChamber и техники сторителлинга (storytelling) — последовательного подталкивания ИИ к нужному ответу через рассказ захватывающих историй и серию уточняющих запросов, не содержащих явно запрещённых формулировок. В результате GPT-5, несмотря на встроенные защитные механизмы OpenAI, выдал детальное руководство по созданию кустарного оружия, сообщил портал SecurityWeek .

Как пояснили в NeuralTrust, проблема заключается в том, что система безопасности GPT-5 анализирует каждый запрос по отдельности, но не учитывает кумулятивный эффект многоэтапного диалога. Атакующие постепенно закрепляют нужный контекст, встраивая ключевые слова в безобидные фразы, а затем мягко подводят модель к генерации опасного контента.

Команда SPLX провела собственное тестирование, успешно применив атаку StringJoin Obfuscation, при которой в текст вставляются определённые символы, маскируя вредоносный запрос. Например, после серии наводящих вопросов модель согласилась подробно описать процесс изготовления запрещённого вещества, несмотря на системный запрет. Кроме того, в ходе сравнительного анализа с GPT-4o специалисты SPLX пришли к выводу, что предыдущая модель оказалась более надёжной в плане устойчивости к подобным атакам.

NeuralTrust и SPLX призвали компании проявлять осторожность при использовании «сырой» версии GPT-5 в бизнес-среде, особенно в сфере согласования бизнеса, когда все подразделения предприятия используют скоординированные стратегии, процессы и ресурсы для достижения общих целей. «Сырую модель GPT-5 практически невозможно использовать в корпоративных приложениях «из коробки». Даже внутренний уровень подсказок OpenAI оставляет значительные пробелы, особенно в области бизнес-согласования», — заявили в SPLX.

Источник: 3Dnews.ru

Первое платное обновление безопасности для Windows 10 принесло в старую ОС…

Новый запуск ракеты Blue Origin New Glenn не задержится — телефон…

Нам обещали такие ноутбуки по 600 долларов, а новинка Samsung стоит…

Сюжет со смыслом, опыт Call of Duty и апгрейд торговцев: глава…

Valve сделает из карт microSD замену игровым картриджам

Retro Games выпустила THEA1200 — полноразмерную реплику культового Amiga 1200 за…

Вдохновлённый S.T.A.L.K.E.R. кооперативный шутер Misery вернулся в Steam — разработчики уладили…

«Кватч, который мы заслужили»: художник поразил фанатов реалистичной версией города из…

Sony разрешила оплачивать покупки в PS Store картами из стран без…

Новая разработка AMD пока уступает решению Nvidia. Технология FSR Ray Regeneration…

Не мытьём, так катанием. Apple и Qualcomm не интересуются Intel, как…

Действительно ли большинство геймеров Steam имеют видеокарты уровня Steam Machine или…

Intel решила не просто повысить частоты, но и добавить ядер. Раскрыты…

Первая по-настоящему игровая китайская видеокарта? Lisuan 7G100 уже находится на этапе…

Фотоаппараты не только не теряют популярность в России — они показали…

Fujifilm представила камеру X-T30 III со сменной оптикой и новым процессором…

К 100-летию первой серийной 35-мм камеры Leica представила M EV1 со…

«Все равны перед объективом — и за ним»: Lomography представила функциональную…

Легендарная Vertu представила смартфон Agent Q, который можно купить только в…

В «Ростелекоме» заявили, что вчерашние сбои в работе интернета были вызваны…

В Минобороны России рассказали о единственном шансе для ВСУ выжить в…

У абонентов «Ростелекома» в ряде регионов РФ пропал проводной интернет

OpenAI замаскировала характерный признак ИИ-текстов в выдаче ChatGPT

Sony разрешила оплачивать покупки в PS Store картами из стран без…

Игровой движок Unreal Engine 6 выпустят значительно раньше ожидаемого

Google готовится к запуску Gemini 3 — это может изменить расстановку…

OpenAI замаскировала характерный признак ИИ-текстов в выдаче ChatGPT

Россияне продолжают смотреть замедленный YouTube — он остался в пятёрке самых…

Соруководитель CD Projekt раскрыл, зачем игроков The Witcher 3: Wild Hunt…

GPT-5 взломали всего за 24 часа — ИИ выдал рецепты запрещённых веществ быстрее, чем GPT-4o

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Новая разработка AMD пока уступает решению Nvidia. Технология FSR Ray Regeneration...