OpenAI запустила модели GPT-5.4 и GPT-5.4 Pro для ChatGPT, API и Codex: они усиливают работу с кодом, документами и таблицами, улучшают веб‑поиск и умеют нативно управлять компьютером с контекстом до 1 млн токенов
Что происходит
- OpenAI объявила о запуске новых моделей GPT-5.4 и GPT-5.4 Pro для ChatGPT, API и Codex, позиционируя GPT-5.4 как флагманскую модель для профессиональной работы.
- В ChatGPT модель GPT-5.4 Thinking приходит на смену GPT-5.2 Thinking для пользователей тарифов Plus, Team и Pro, при этом GPT-5.2 Thinking останется доступна в разделе Legacy Models до 5 июня 2026 года.
- GPT-5.4 объединяет в одной модели последние улучшения OpenAI в области рассуждения, программирования и агентных рабочих процессов, а GPT-5.4 Pro ориентирована на максимальную производительность в самых сложных задачах.
- Цены на входные токены повышены относительно GPT-5.2 и составляют $2,5 США за 1 млн токенов для GPT-5.4 и $30 за 1 млн токенов для GPT-5.4 Pro.
- Модель поддерживает контекст до 1 млн токенов в Codex как экспериментальную функцию: это позволяет планировать и проверять длительные задачи, хотя запросы свыше стандартного окна в 272 тыс. токенов учитываются с повышающим коэффициентом 2 по лимитам использования.
- В ChatGPT GPT-5.4 Thinking научилась заранее показывать план рассуждений для сложных запросов, чтобы пользователь мог скорректировать курс прямо по ходу формирования ответа и сократить число дополнительных диалоговых шагов.
- GPT-5.4 улучшила работу встроенного веб‑поиска: на бенчмарке BrowseComp, который оценивает устойчивый поиск сложной информации в интернете, она набрала 82,7% против 65,7% у GPT-5.2, а версия GPT-5.4 Pro достигла 89,3%.
- В части надежности фактов OpenAI сообщает, что на обезличенной выборке пользовательских запросов GPT-5.4 выдает отдельные ошибочные утверждения на 33% реже, а полные ответы с хотя бы одной ошибкой — на 18% реже, чем GPT-5.2.
- В юридической сфере старший исследователь Harvey Нико Групен заявил, что на их оценке BigLaw Bench GPT-5.4 набрала 91% и лучше других моделей справляется со структурированием сложного сделочного анализа и поддержанием точности на длинных контрактах.
- Отдельное внимание в GPT-5.4 уделено офисной работе: на внутреннем наборе заданий по финансовому моделированию в таблицах, имитирующем работу младшего аналитика инвестбанка, модель набрала в среднем 87,3% против 68,4% у GPT-5.2.
- GPT-5.4 стала первой универсальной моделью OpenAI с нативными возможностями управления компьютером. Она умеет управлять приложениями через кодовые библиотеки вроде Playwright, а также через эмуляцию мыши и клавиатуры по скриншотам интерфейса.
- Для настройки поведения в ChatGPT модель GPT-5.4 Thinking теперь выдает развернутый преамбулой план действий для сложных запросов, а пользователи могут вносить правки по ходу генерации ответа, не начиная диалог заново.
- Компания продолжила исследования безопасности цепочек рассуждений (Chain-of-Thought) и представила новую открытую оценку controllability («управляемости»), проверяющую, могут ли модели намеренно скрывать свое рассуждение; по данным OpenAI, способность GPT-5.4 Thinking к такому сокрытию низкая, что рассматривается как позитивный фактор для мониторинга.
Что это значит
- Запуск GPT-5.4 показывает смещение фокуса разработчиков искусственного интеллекта от общих разговорных возможностей к прикладной, «рабочей» эффективности: модель целенаправленно оптимизирована под задачи профессионалов — от юристов и аналитиков до разработчиков и операторов сложных корпоративных систем.
- По сравнению с предыдущими поколениями GPT-5.2 и GPT-5.3-Codex новая модель фактически объединяет два направления развития ИИ — умение рассуждать и умение писать код — в одном фронтирном решении. Это снижает потребность в одновременном использовании нескольких разных моделей и упрощает архитектуру сложных цифровых помощников.
- Рост показателей на бенчмарках GDPval, SWE-Bench Pro, OSWorld-Verified и BrowseComp указывает не только на увеличение «сырой» точности, но и на усиление агентных навыков: модели становятся способными планировать длинные последовательности действий, переключаться между инструментами и систематически доводить задачу до конца.
- Появление нативного управления компьютером и браузером фиксирует важный этап в развитии ИИ: вместо простых текстовых подсказок модели начинают полноценно работать в операционных системах и веб‑средах. Это приближает сценарий, когда корпоративные «цифровые сотрудники» берут на себя рутинные операции в бухгалтерии, поддержке клиентов, документообороте и анализе данных.
- Одновременно OpenAI пытается сдерживать рост стоимости за счет токенной эффективности: более высокая цена за 1 млн токенов компенсируется тем, что модели требуется меньше токенов для решения той же задачи. Для бизнеса это означает, что фокус смещается со стоимости единицы ресурса к стоимости полностью решенной задачи.
- Улучшения в офисной работе — моделировании в таблицах, подготовке презентаций и документов — вписываются в общий тренд автоматизации «беловоротничковых» процессов. В краткосрочной перспективе это может высвободить время аналитиков, маркетологов и юристов от черновой подготовки материалов, но в долгосрочной ставит вопрос о перераспределении ролей и навыков на рынке интеллектуального труда.
- Высокие оценки GPT-5.4 в юридических и финансовых сценариях демонстрируют, что ИИ переходит от статуса вспомогательного инструмента к роли соавтора документов, моделей и отчетов. Это усиливает требования к управлению рисками: проверке фактов, внутренним регламентам использования ИИ и ответственности за конечный результат.
- Расширение возможностей компьютерного зрения, особенно для документов и интерфейсов, трансформирует способы работы с информацией: ИИ может напрямую «читать» сканы договоров, отчеты или скриншоты систем, избавляя людей от ручного ввода и сверки данных. Это ключ к автоматизации отраслей, где до сих пор многое завязано на бумажный или полуструктурированный документооборот.
- С точки зрения экосистемы разработчиков GPT-5.4 закрепляет тренд на появление сложных агентных систем, в которых одна мощная модель оркестрирует десятки и сотни внешних инструментов.
Источник: https://trends.rbc.ru/trends/industry/69aac6bc9a7947e1cb0a92b8