OpenAI обновила прайс для API: появились детальные ставки для GPT‑5.4 и его «mini/nano» вариантов, а контейнеры для выполнения кода начинают считаться по 20‑минутным сессиям. Разбираемся, что именно поменялось и как это отразится на бюджете реальных проектов.
В прайс-листе OpenAI для разработчиков появились новые ориентиры по стоимости работы с моделями и инструментами. Самое заметное изменение — контейнеры для запуска кода теперь оплачиваются не «за контейнер как факт существования», а привязываются к сессиям по 20 минут. Параллельно уточнили цены на линейку GPT‑5.4 и отдельные сервисные возможности, вроде веб‑поиска.
Что стало понятнее с ценами на GPT‑5.4
В актуальном прайсе OpenAI отдельно указаны ставки для GPT‑5.4, а также более доступных вариантов mini и nano — это упрощает планирование расходов под разные сценарии: от прототипов до нагруженных продакшен‑сервисов.
- GPT‑5.4: вход — $2.50 за 1M токенов, кэшированный вход — $0.25 за 1M, выход — $15.00 за 1M.
- GPT‑5.4 mini: вход — $0.750 за 1M, кэшированный вход — $0.075 за 1M, выход — $4.500 за 1M.
- GPT‑5.4 nano: вход — $0.20 за 1M, кэшированный вход — $0.02 за 1M, выход — $1.25 за 1M.
На практике это подталкивает к более «компонентной» архитектуре: тяжёлую модель — на задачи, где важны качество и устойчивость рассуждений, а mini/nano — на массовые операции (классификации, черновики, рутинные преобразования, подсказки в интерфейсе).
Контейнеры: ключевой сдвиг — оплата по 20-минутным сессиям
OpenAI оставила базовую стоимость за объём, но изменила принцип расчёта. Раньше цена была указана «за контейнер», а с 31 марта 2026 — «за 20‑минутную сессию контейнера».
- Сейчас: 1 GB — $0.03 / 64 GB — $1.92 за контейнер.
- С 31 марта 2026: 1 GB — $0.03 / 64 GB — $1.92 за 20 минут (сессию) на контейнер.
Почему это важно: контейнеры обычно используют, когда нужно безопасно выполнить код, собрать артефакты, прогнать тесты или подготовить данные. Если у вас агенты «живут» долго и держат контейнеры открытыми, новая логика делает простой дороже — бюджет начнёт зависеть от времени, а не только от факта запуска.
Простой пример (арифметика по новому правилу): если контейнер 64 GB активно работает около 1 часа, это примерно 3 сессии по 20 минут, то есть около $5.76 за час (3 × $1.92). Это не прогноз затрат, а удобная оценка, чтобы прикинуть порядок цифр и решить, где стоит оптимизировать время работы контейнеров.
Инструменты: веб‑поиск и нюансы региональной обработки
В прайсе отдельно выделена стоимость встроенного веб‑поиска как инструмента для моделей — он тарифицируется по числу вызовов.
- Web search: $10.00 за 1k вызовов; токены контента из поиска указаны как бесплатные.
Также в условиях отмечено, что стандартные ставки применимы для контекстов до 270K, а эндпоинты, связанные с data residency и regional processing, получают доплату 10% для моделей, выпущенных после 05.03.2026. Для команд с требованиями к размещению данных это превращается в понятный «налог на комплаенс», который лучше закладывать в смету заранее.
Что сделать разработчикам и владельцам продуктов прямо сейчас
- Проверьте, где можно перейти на mini/nano: не все цепочки нуждаются в «самой умной» модели — часто хватает более дешёвого варианта без ухудшения пользовательского опыта.
- Пересмотрите жизненный цикл контейнеров: выгоднее запускать их ближе к моменту выполнения задачи и завершать сразу после получения результата.
- Добавьте бюджет на веб‑поиск, если вы используете «обогащение» ответов данными из интернета — стоимость теперь удобнее считать по вызовам.
- Отдельно оцените требования по data residency, чтобы 10% надбавка не стала неожиданностью в конце месяца.
В итоге обновлённый прайс превращает «эксперименты с агентами и инструментами» в более управляемую экономику: можно точнее выбирать модель под задачу, а затраты на исполнение кода — считать по времени работы контейнеров, как в привычных облачных сценариях.
