OpenAI обновила генерацию изображений в ChatGPT до версии Images 2.0 — модель заметно лучше справляется с мелким текстом, интерфейсными элементами и сложными композициями. Появился режим «обдумывания», который помогает делать серии картинок за один запрос и проверять результат перед выдачей.
OpenAI представила обновлённую генерацию изображений для ChatGPT — Images 2.0. Главная перемена для обычных пользователей звучит неожиданно приземлённо: картинки стали лучше «держать» текст. Там, где раньше появлялись странные буквы и псевдослова, теперь чаще получается макет, который не стыдно показать как черновик постера, меню или карточки товара.
Почему все упёрлись именно в текст на изображениях
У многих генераторов картинок слабое место — надписи: мелкие шрифты, ценники, подписи на кнопках, таблички и любая «полиграфия». Из-за этого нейросеть могла нарисовать красивый фон, но «сломать» самое важное — информацию. Images 2.0 как раз целится в эту боль: компания обещает более точное следование инструкциям и лучшее качество в деталях вроде маленького текста, иконок, UI-элементов и плотных композиций при разрешении до 2K.
Что нового в Images 2.0: коротко и по делу
- Режим “thinking” (обдумывания): модель может сделать дополнительные шаги перед финальной картинкой — например, проверить себя и собрать результат более аккуратно.
- Веб-поиск как часть генерации: в «обдумывающем» сценарии модель умеет искать актуальную информацию в интернете и опираться на неё при создании визуала.
- Несколько изображений за один запрос: можно попросить сразу серию — например, набор креативов разных форматов или многостраничный комикс/буклет.
- Гибкие размеры и пропорции: генерацию проще подгонять под баннеры, сторис, обложки и «нестандартные» макеты без ручной переклейки.
- Лучше с нелатинскими письменностями: OpenAI заявляет улучшения в рендеринге текста для языков и письменностей вроде японского, корейского, хинди и бенгальского.
- Ограничение по знаниям: у модели заявлен срез знаний до декабря 2025 — в сюжетах про события после этой даты точность может проседать.
Где это пригодится обычным людям (и малому бизнесу)
Если раньше генераторы изображений были сильнее в «красивых картинках», то теперь упор смещается к практичным задачам:
- Маркетинговые материалы: быстрые варианты афиш, баннеров, обложек и карточек с ценами/условиями — без ручной доработки каждого слова.
- Пакеты креативов: один запрос — и вы получаете сразу несколько размеров под разные площадки.
- Комиксы и пошаговые инструкции: когда нужно не одно изображение, а серия с единым стилем и логикой.
Что это меняет для разработчиков
Модель доступна не только в интерфейсе: OpenAI также открывает доступ через API под именем gpt-image-2. Она позиционируется как модель для генерации и редактирования изображений и поддерживает вход как текстом, так и изображением. Стоимость в API зависит от качества и итогового разрешения.
Про ограничения и безопасность
У роста реалистичности есть обратная сторона: чем убедительнее картинка, тем проще злоупотреблять — от поддельных «скриншотов» до более правдоподобных дипфейков. В системных материалах по безопасности OpenAI отдельно подчёркивает, что повышенная реалистичность требует более жёстких мер защиты и контроля сценариев, связанных с реальными людьми и чувствительным контентом.
Итог: почему новость действительно важная
Images 2.0 — это шаг от «генератора вдохновения» к инструменту, который закрывает прикладные задачи: текст, макеты и серия материалов в одном стиле. Если обещания по качеству надписей подтвердятся у большинства пользователей, то изображения из нейросети станут чаще попадать в реальную работу — не как забавная картинка, а как ускоритель для задач, которые раньше всё равно приходилось доделывать вручную.
