ChatGPT Images 2.0
Сегодня OpenAI запустил "убийцу Nano Banana" - ChatGPT Images 2.0. Генерация изображений серьёзно обновилась: быстрее, креативнее и лучше передаёт детали.
Передовая модель обработки изображений, способная решать сложные визуальные задачи и создавать точные, готовые к использованию изображения, отличающиеся более четкой обработкой, разнообразными макетами и интеллектуальными возможностями, сравнимыми с человеческим мышлением.
Разбираем детально.
Точность и контроль — наконец-то
Главная боль всех, кто работал с AI-изображениями — модель делала "примерно то что надо". Текст внутри картинки был кривым, иконки размытыми, мелкие детали разваливались.
Images 2.0 заявляет о кардинальном улучшении: мелкий текст, UI-элементы, иконки, плотные композиции — всё это теперь рендерится корректно. Разрешение в API до 2K. И главное модель следует инструкциям, а не интерпретирует их по-своему.
Вместо "примерно в нужном направлении", теперь получаем результат, который можно использовать сразу.
Многоязычность
Предыдущие модели нормально работали с латиницей. Всё остальное — лотерея.
Images 2.0 заявляет о серьёзных улучшениях в японском, корейском, китайском, хинди и бенгальском. Причём не просто "правильно написать слово", а генерировать визуально связные выходы, где язык является частью дизайна — постеры, мангу, рекламу, комиксы.
Для глобального рынка это важно. Локализованная реклама, обучающие материалы, контент на родном языке — всё это теперь реальнее.
Стиль и реализм — модель перестала "выглядеть как AI"
Один из главных маркеров AI-изображений — они выглядят "слишком идеально" или наоборот, разваливаются на деталях.
Images 2.0 научился воспроизводить мелкие дефекты, которые делают фото живым — зерно плёнки, случайное освещение, несовершенную кадровку. Плюс улучшенная работа с конкретными стилями: кино, пиксель-арт, манга, fashion. Не "в духе стиля", а точное попадание в него.
Гибкие форматы — от 1:3 до 3:1
Раньше форматы были ограничены. Теперь поддерживаются соотношения сторон от вертикального 1:3 до горизонтального 3:1.
Что это даёт на практике: широкие баннеры, сторис, постеры, LinkedIn-обложки, мобильные экраны — всё в одном инструменте без дополнительной обрезки.
Режим thinking — модель думает перед тем как рисовать
Это самое интересное изменение.
Images 2.0 — первая imagen-модель OpenAI с режимом рассуждений. Когда включён thinking, модель может искать информацию в интернете, генерировать до восьми связных изображений из одного промпта с сохранением персонажей и объектов, и проверять собственный результат перед выдачей.
Практический пример из официального анонса: попросить создать рекламные материалы для кофейни сразу в четырёх форматах — Twitter, Instagram Stories, Instagram Feed, LinkedIn. Модель сама адаптирует под каждый формат, сохраняя визуальный стиль.
Доступно для Plus, Pro и Business подписчиков.
Реальные знания — срез до декабря 2025
База знаний модели обновлена до декабря 2025 года. Это означает, что инфографики, объяснительные материалы и визуальные сводки будут точнее отражать актуальное состояние мира.
Codex и API
Images 2.0 доступен в Codex — это значит, что дизайн и разработка теперь в одном пространстве. Прототип UI, концепт, готовый продукт — без переключения между инструментами.
В API модель называется gpt-image-2. Canva, Figma, Adobe и другие уже интегрируют.
Что не умеет (честно)
OpenAI сами перечислили ограничения: оригами и схемы со скрытыми поверхностями, кубик Рубика, очень плотные повторяющиеся текстуры (песок, мелкая сетка), стрелки и подписи в диаграммах всё ещё могут ошибаться.
Доступно уже сегодня — бесплатно для всех пользователей ChatGPT.