ChatGPT Images 2.0

Сегодня OpenAI запустил "убийцу Nano Banana" - ChatGPT Images 2.0. Генерация изображений серьёзно обновилась: быстрее, креативнее и лучше передаёт детали.

Передовая модель обработки изображений, способная решать сложные визуальные задачи и создавать точные, готовые к использованию изображения, отличающиеся более четкой обработкой, разнообразными макетами и интеллектуальными возможностями, сравнимыми с человеческим мышлением.

Разбираем детально.

Точность и контроль — наконец-то

Главная боль всех, кто работал с AI-изображениями — модель делала "примерно то что надо". Текст внутри картинки был кривым, иконки размытыми, мелкие детали разваливались.

Images 2.0 заявляет о кардинальном улучшении: мелкий текст, UI-элементы, иконки, плотные композиции — всё это теперь рендерится корректно. Разрешение в API до 2K. И главное модель следует инструкциям, а не интерпретирует их по-своему.

ChatGPT Images 2.0

Вместо "примерно в нужном направлении", теперь получаем результат, который можно использовать сразу.

ChatGPT Images 2.0

Многоязычность

Предыдущие модели нормально работали с латиницей. Всё остальное — лотерея.

Images 2.0 заявляет о серьёзных улучшениях в японском, корейском, китайском, хинди и бенгальском. Причём не просто "правильно написать слово", а генерировать визуально связные выходы, где язык является частью дизайна — постеры, мангу, рекламу, комиксы.

ChatGPT Images 2.0

Для глобального рынка это важно. Локализованная реклама, обучающие материалы, контент на родном языке — всё это теперь реальнее.

ChatGPT Images 2.0

Стиль и реализм — модель перестала "выглядеть как AI"

Один из главных маркеров AI-изображений — они выглядят "слишком идеально" или наоборот, разваливаются на деталях.

ChatGPT Images 2.0

Images 2.0 научился воспроизводить мелкие дефекты, которые делают фото живым — зерно плёнки, случайное освещение, несовершенную кадровку. Плюс улучшенная работа с конкретными стилями: кино, пиксель-арт, манга, fashion. Не "в духе стиля", а точное попадание в него.

ChatGPT Images 2.0

Гибкие форматы — от 1:3 до 3:1

Раньше форматы были ограничены. Теперь поддерживаются соотношения сторон от вертикального 1:3 до горизонтального 3:1.

ChatGPT Images 2.0

Что это даёт на практике: широкие баннеры, сторис, постеры, LinkedIn-обложки, мобильные экраны — всё в одном инструменте без дополнительной обрезки.

Режим thinking — модель думает перед тем как рисовать

Это самое интересное изменение.

Images 2.0 — первая imagen-модель OpenAI с режимом рассуждений. Когда включён thinking, модель может искать информацию в интернете, генерировать до восьми связных изображений из одного промпта с сохранением персонажей и объектов, и проверять собственный результат перед выдачей.

ChatGPT Images 2.0

Практический пример из официального анонса: попросить создать рекламные материалы для кофейни сразу в четырёх форматах — Twitter, Instagram Stories, Instagram Feed, LinkedIn. Модель сама адаптирует под каждый формат, сохраняя визуальный стиль.

Доступно для Plus, Pro и Business подписчиков.

Реальные знания — срез до декабря 2025

База знаний модели обновлена до декабря 2025 года. Это означает, что инфографики, объяснительные материалы и визуальные сводки будут точнее отражать актуальное состояние мира.

Codex и API

Images 2.0 доступен в Codex — это значит, что дизайн и разработка теперь в одном пространстве. Прототип UI, концепт, готовый продукт — без переключения между инструментами.

В API модель называется gpt-image-2. Canva, Figma, Adobe и другие уже интегрируют.

Что не умеет (честно)

OpenAI сами перечислили ограничения: оригами и схемы со скрытыми поверхностями, кубик Рубика, очень плотные повторяющиеся текстуры (песок, мелкая сетка), стрелки и подписи в диаграммах всё ещё могут ошибаться.

Доступно уже сегодня — бесплатно для всех пользователей ChatGPT.

1 комментарий