OpenAI представила модель Images 2.0 для генерации изображений в ChatGPT
Она уже доступна в чат-боте и через API.
Источник: OpenAI
- Images 2.0 — первая визуальная модель компании с возможностями «рассуждений», рассказала OpenAI. Когда в ChatGPT выбрана рассуждающая модель, Images 2.0 может выполнять поиск релевантной информации в интернете, генерировать несколько изображений для одного промпта и перепроверять свой результат.
- В отличие от других моделей для генерации изображений компании, Images 2.0 лучше воспроизводит языки, которые используют не латинский алфавит, — в частности, японский, корейский, китайский, хинди и бенгали. Сгенерированные на них тексты не только отображаются корректно, но и написаны связно.
- Images 2.0 лучше передаёт детали — например, на фотографиях добавляет «крошечные недостатки» для придания реализма, — точнее воспроизводит кинематографические кадры, пиксельную графику и другие стили.
- Компания отметила, что пока Images 2.0 может быть сложно справляться с задачами вроде генерации руководства по оригами, головоломок или деталей на наклонных поверхностях.
- Images 2.0 доступна всем пользователям ChatGPT и Codex. Режим работы с рассуждениями — подписчикам ChatGPT Plus, Pro и Business. Модель gpt-image-2 также доступна в API.
Примеры пользователей, которые начали получать доступ 21 апреля 2026 года
Сравнение результатов генерации Nano Banana Pro от Google (слева) и gpt-image-2 (справа). Источник: @ViralOps_
Источник: @mark_k
Источник: @ViralOps_
Источник: @ervintrust
Источник: @haider1
Источник: @KaladinFree
Источник: @NanoGPTcom
Источник: DevHub
Источник: «Жилзона»
Источник: «рис.AI»
Источник: «сбежавшая нейросеть»
30 комментариев