Телефоны

OpenAI облажалась с диаграммами на презентации GPT-5 — Альтман признал ошибку

9 августа

Во время масштабной прямой трансляции с презентацией модели искусственного интеллекта GPT-5 компания OpenAI продемонстрировала несколько диаграмм, которые должны были иллюстрировать впечатляющие способности новой модели. Однако при более внимательном рассмотрении некоторые графики оказались построены с серьёзными неточностями.

HUAWEI Pura 80 Ultra глазами фотографа
Обзор смартфона HUAWEI Pura 80 Ultra: зум, которому нет равных
Первый взгляд на смартфон HUAWEI Pura 80 Ultra
Пять причин полюбить HONOR 400
Обзор смартфона HONOR 400: реаниматор
HUAWEI nova Y73: самый недорогой смартфон с кремний-углеродной батареей
Обзор HUAWEI MatePad Pro 12.2’’ (2025): обновление планшета с лучшим экраном
Обзор смартфона HUAWEI nova Y63: еще раз в ту же реку
Обзор ноутбука HONOR MagicBook Pro 14 (FMB-P) на платформе Core Ultra второго поколения
Пять причин полюбить ноутбук HONOR MagicBook Pro 14

Источник изображения: Mariia Shalabaieva / unsplash.com

На одной из диаграмм, которая, по иронии, должна была демонстрировать высокие результаты GPT-5 в «оценке склонности к обману у разных моделей», шкала не соответствует числовым значениям. Например, для «обмана при написании кода» у GPT-5 указано значение 50,0 %, тогда как у модели o3 — 47,4 %. Однако столбец для o3 на диаграмме оказался выше. Более того, в корпоративном блоге OpenAI указано совсем другое значение для GPT-5 — 16,5 %, что, вероятно, и является верным показателем.

Источник изображения: x.com/shreyk0

В тесте SWE-bench Verified один из показателей GPT-5 должен быть ниже, чем у o3, но ему соответствует более высокий столбец диаграммы; на этой же диаграмме результаты o3 и GPT-4o различаются, но иллюстрируются столбцами одинакового размера. В OpenAI восприняли ошибку всерьёз — гендиректор компании Сэм Альтман (Sam Altman) повинился и добавил, что в корпоративном блоге опубликованы правильные версии.

Источник изображения: x.com/EgeErdil2

В OpenAI не уточнили, использовалась ли сама GPT-5 для построения диаграмм, но такой инцидент явно не добавляет доверия в контексте масштабной презентации новой модели. Особенно с учётом того, что разработчики заявили о значительном снижении уровня галлюцинаций у GPT-5.

Источник: 3Dnews.ru

AMD всё же откроет исходный код FSR 4, но не полностью —…

13-дюймовый экран 21:9, 16ГБ/1ТБ памяти, механическая клавиатура и Ryzen AI 9…

Польский аналитик объяснил, зачем CD Projekt Red выпускать новое сюжетное дополнение…

RTX 5090 Laptop, Core Ultra 9 HX, экран Mini-LED и два…

Fable, Forza Horizon 6 и новая игра от создателей «Покемонов»: Microsoft…

Польский аналитик объяснил, зачем CD Projekt Red выпускать новое сюжетное дополнение…

Ремастеры Fallout 3 и New Vegas, Wolfenstein 3, шутер по StarCraft…

Sony запатентовала ИИ-помощника, который сможет проходить игры за вас

Nvidia представила DLSS 4.5 — ещё больше сгенерированных ИИ кадров с MFG…

Европейцы отвернулись от процессоров Intel, а старый Ryzen 7 5800X стал…

Представлена видеокарта половинной высоты Vastarmor RX 9060 XT LP с 16…

Новый король игровых процессоров. Ryzen 7 9850X3D впервые сфотографировали целиком и…

Китайские власти попросили технологические компании не покупать ускорители Nvidia H200

Новая SoC Snapdragon X2 Elite Extreme выдаёт уровень Apple M4 Max…

«В кадре появился кот»: умная IP-камера «Яндекса» научилась рассказывать о том,…

У умной туалетной камеры Kohler Dekoda со сквозным шифрованием не оказалось…

Sony представила A7 V — свою первую полнокадровую камеру с частично-стековым сенсором и…

Первой цифровой камере Kodak исполнилось 50 лет — она весила 3,6…

Популярная камера для видеографов стала ещё лучше. Представлена Sony A7 V:…

В Британии заявили об унижении Мерца из-за стремления ввести войска на…

Micron на следующей неделе заложит фундамент крупнейшего комплекса по производству памяти…

Lenovo представила портативную консоль Legion Go 2 на базе SteamOS — альтернатива…

В США заявили о выходе российской подлодки на защиту прорвавшего блокаду…

Honor представила смартфон Power2 с батарей на 10 080 мА·ч и…

Власти потребовали от китайских компаний отменить заказы на американские ускорители Nvidia…

Забывчивость Logitech обернулась сбоями в работе миллионов мышей по всему миру

Gigabyte показала GeForce RTX 5090 Infinity с потайным вентилятором и нетривиальным…

Миллионы игроков по всему миру остались без доступа к League of…

Sandisk похоронила марки WD_Black и WD Blue — теперь её SSD будут…

OpenAI облажалась с диаграммами на презентации GPT-5 — Альтман признал ошибку

ОСТАВЬТЕ ОТВЕТ Отменить ответ

«В кадре появился кот»: умная IP-камера «Яндекса» научилась рассказывать о том,...