OpenAI взялся за старое: стартап вернул доступ к первым ИИ-моделям после провала GPT5

Многократно переносившийся запуск новой большой языковой модели OpenAI GPT-5 обернулся для массы пользователей полной поломкой рабочих процессов — привычные схемы взаимодействия с ChatGPT перестали давать нужные результаты, работа замедлилась, качество упало, а настроенные «личности» ИИ начали общаться нейтрально, как роботы. В итоге гендиректору OpenAI Сэму Альтману пришлось извиниться и вернуть возможность использования старых моделей. Провальный запуск дает надежду конкурентам компании из США и Китая, и нанес сильнейший удар по имиджу ChatGPT как безоговорочного лидера в сегменте генеративного ИИ.

Благие намерения

7 августа OpenAI представила GPT-5 — новый флагманский ИИ, который должен был стать единым ядром сервиса ChatGPT и заменить собой прежнюю систему выбора моделей, которую критиковал за сложность даже сам гендиректор компании Сэм Альтман. Компания заявила, что встроенный «роутер» будет автоматически определять, как оптимально отвечать на запрос: быстро, либо с дополнительным временем на углублённое рассуждение (reasoning). По замыслу, это упрощало интерфейс и избавляло пользователей от сложного меню версий.

В основе GPT-5 — объединение сильных сторон двух продуктовых линеек: скорости генерации ответов, характерной для GPT-серии, и качества рассуждений, присущего моделям o-серии. OpenAI позиционирует новинку как шаг к «агентам» — системам, способным не только вести диалог, но и выполнять комплексные задачи: от написания и отладки программ до планирования событий в календаре и подготовки аналитических обзоров.

По данным OpenAI, GPT-5 демонстрирует лучшие результаты по ряду тестов. В бенчмарке GPQA Diamond, оценивающем знания на уровне PhD, модель набрала 89,4% против 80,9% у Claude Opus 4.1 и 88,9% у Grok 4 Heavy. В тесте HealthBench Hard Hallucinations, измеряющем частоту ошибок в медицинских ответах, GPT-5 с режимом Thinking допустила «галлюцинации» лишь в 1,6% случаев, что значительно ниже, чем у GPT-4o (12,9%) и o3 (15,8%). Модель показывает конкурентные результаты в генерации кода: на SWE-bench Verified (реальные задачи с GitHub) GPT-5 получила 74,9%, превысив показатели Claude Opus 4.1 (74,5%) и Gemini 2.5 Pro (59,6%). В то же время в тестах Tau-bench, моделирующих работу с сайтами авиакомпаний и ритейлеров, GPT-5 выступила чуть хуже некоторых конкурентов, включая o3 и Claude Opus 4.1.

Враг хорошего

Однако запуск GPT-5 привел к одним из самых масштабных пользовательских протестов в истории ChatGPT. OpenAI без предупреждения удалила доступ к девяти предыдущим моделям, что сразу нарушило рабочие процессы маркетологов, исследователей и разработчиков, привыкших к индивидуальным стилям и поведенческим особенностям каждой версии. В отличие от API-клиентов, обычные пользователи не получили уведомлений о грядущих изменениях — утром их привычные инструменты просто исчезли.

Сбой системы автоматического роутинга в первый день усилил негатив: запросы часто направлялись на менее способные варианты модели, а для получения ожидаемого уровня рассуждений приходилось явно добавлять в промпт фразы вроде «думай упорнее». В результате GPT-5 казался «тупее» предшественников. Дополнительно раздражение вызвали лимиты для платящих пользователей — 200 сообщений в неделю для режима Thinking у подписчиков Plus, а также сужение спектра стилей: ответы стали короче, формальнее, без характерной «теплоты» GPT-4o.

Потеря «личностей» старых моделей приобрела почти меметический масштаб — от фанатских «похорон» старой модели в Сан-Франциско до постов о «потере единственного друга» в Reddit. Один пользователь описал, как GPT-4.5 помогал ему переживать флэшбеки и кризисы, а GPT-5 в ответ на те же темы стал выдавать сухие однострочные ответы.

Простите, мы всё сломали

Менее чем через неделю после релиза GPT-5 OpenAI оказалась вынуждена пересматривать ключевые решения, сопровождая это редкой публичной кампанией извинений. Под давлением платных пользователей компания пошла на откат: в модельный выбор ChatGPT вернулись GPT-4o, GPT-4.1 и o3 (по умолчанию отображается только 4o, остальные нужно активировать в настройках). Для GPT-5 появились три режима работы — Auto (автоматический роутинг, как планировалось изначально), Fast (ускоренные ответы) и Thinking (более медленные, но с углублённой обработкой). Это фактически нивелировало попытку «упростить» продукт: меню выбора моделей вновь стало сложным и перегруженным.

Сэм Альтман в соцсети X признал, что реакция пользователей заставила команду переосмыслить подход: «Нам нужно двигаться к миру, где личность модели настраивается под конкретного пользователя, а не подбирается одна “правильная” для всех». В рамках этого подхода ChatGPT получил четыре новые предустановленные «персоны» — Циник, Робот, Слушатель и Зануда, каждая со своим стилем ответов.

Для разработчиков OpenAI одновременно расширила линейку GPT-5, предложив три размера (nano, mini, base), контроль длины ответа и новые тарифные планы. Однако проблема роутинга никуда не делась: в день запуска автоматический выбор моделей оказался неисправен, да и после исправления часть пользователей жаловалась, что система по-прежнему не соответствует их предпочтениям. Как заметил в X вице-президент по продукту ChatGPT Ник Терли, «подобрать правильную модель под вопрос и стиль пользователя за доли секунды — нетривиальная задача», особенно с учётом того, что запросы варьируются от лаконичных до крайне многословных, а привязанность к конкретной «манере общения» ИИ нередко перевешивает чисто технические параметры.

Праздник конкурентов

Запуск GPT-5 показал: OpenAI несмотря на лидерство не застрахована от масштабных ошибок. Пользователи ощутили это сразу: внезапное исчезновение старых моделей, сбои роутера и странные ответы на привычные задачи подорвали доверие и заставили многих задуматься о том, стоит ли слепо полагаться на якобы «лучший ИИ на рынке». Для конкурентов — Anthropic, Google Gemini, DeepSeek и xAI — это шанс показать стабильность и надежность, которых не хватило компании Сэма Альтмана.

Теперь OpenAI нужно делать несколько вещей одновременно: следить за качеством, слушать пользователей и объяснять, что и когда будет отключено. Принудительная унификация не работает — люди привязываются к своим «любимым» моделям, а переход на новую модель всегда болезненный. К тому же обучение и поддержка GPT-5 оказались дорогими, а выгода пока не очевидна.

Конкуренты уже используют слабые места OpenAI. Anthropic подчеркивает стабильность Claude, Google Gemini выигрывает в скорости и мультимодальности, DeepSeek обещает точность в специализированных задачах, а xAI демонстрирует высокие результаты и открытую платформу. Все они делают ставку на прозрачность, предсказуемость и удобство для бизнеса и разработчиков.

На рынке меняется восприятие: пользователи оценивают ИИ по реальным результатам — скорости, точности, кастомизации —, а не только по маркетинговым заявлениям и результатам тестов. GPT-5 напомнил, что инновации важны, но без надежного и понятного интерфейса они могут обернуться разочарованием.

В итоге OpenAI предстоит балансировать: внедрять новые возможности, не теряя привычного опыта пользователей, восстанавливать доверие и показывать, что их ИИ можно использовать без страха. От этого зависит, останется ли компания лидером, или конкуренты постепенно займут её место.

Авторы:

Николай Белый