DeepSeek объявила о постоянном снижении стоимости API для флагманской модели V4‑Pro — вчетверо относительно «прайса». На практике важнее другое: дешёвым становится кэш, а значит агентские сценарии и повторное использование контекста перестают «съедать» бюджет.
DeepSeek пересмотрела тарифы на API своей флагманской модели V4‑Pro: компания объявила, что прежнее «снижение на 75%» становится постоянной ценой. На бумаге это выглядит как резкое удешевление, но реальный смысл новости — в том, как теперь будет считаться стоимость повторяющихся запросов и кэширования.
Какие цены зафиксировали
После изменения тарифов стоимость пересчёта токенов для V4‑Pro выглядит так:
- входные токены (cache miss): $0.435 за 1 млн (раньше в прайсе было $1.74);
- выходные токены: $0.87 за 1 млн (вместо $3.48);
- попадание в кэш (cache hit): $0.003625 за 1 млн (вместо $0.0145).
Почему в новости есть «нюанс»
V4‑Pro вышла 24 апреля 2026 года, и уже через несколько дней DeepSeek запустила промо‑скидку 75% (сначала до 5 мая, затем её продлили до 31 мая). Теперь компания фактически говорит: «окей, это больше не акция — это базовый тариф».
По сути, многие разработчики и так работали с V4‑Pro по сниженной цене уже несколько недель. Главное отличие — предсказуемость расходов: можно планировать бюджеты, не закладывая риск резкого возврата к «официальному» прайсу.
Что это меняет для разработки: дешёвый кэш
Самая практичная часть обновления — стоимость кэша. В реальных продуктах повторяются одни и те же куски текста:
- системные промпты (правила поведения ассистента);
- описания инструментов (tools/function calling);
- типовой контекст репозитория в задачах по коду (структура проекта, договорённости команды, шаблоны ответов).
Когда кэш становится почти «бесплатным», такие повторяющиеся блоки перестают быть заметной статьёй расходов. Это особенно полезно в агентских сценариях, где модель много раз возвращается к одному и тому же контексту, разбивая задачу на шаги.
Рынок цен: DeepSeek снижает, другие — поднимают
На фоне того, что некоторые конкуренты на последних релизах флагманов повышали цены, DeepSeek продолжает двигаться в противоположную сторону. Компания уже раньше делала ставку на агрессивное удешевление доступа к моделям — это укладывается в её общую стратегию.
Кому стоит обратить внимание
Новость будет особенно полезна тем, кто:
- встраивает LLM в продукт и считает себестоимость запросов «до цента»;
- использует длинные системные инструкции и большой контекст (а значит выигрывает на cache hit);
- строит инструменты для разработки: агенты, ревью кода, автогенерация задач и документации.
Если вы уже используете V4‑Pro через API, имеет смысл пересчитать экономику: при грамотном повторном использовании контекста итоговая стоимость может заметно снизиться даже без изменения качества ответов.
