«Сбер» представил флагманскую модель Kandinsky 6.0 для генерации и редактирования изображений
Она доступна в ИИ-помощнике GigaChat — в веб-версии, приложении и мессенджерах.
Источник здесь и далее: «Сбер»
- Kandinsky 6.0 Image работает до двух раз быстрее в сравнении с предыдущей версией, точнее понимает многосоставные инструкции и аккуратнее делает точечные правки, рассказали в «Сбере». Вырос уровень детализации, ошибок и «галлюцинаций» стало меньше, а текст генерируется корректнее.
- По словам компании, редактирование картинок «стало профессиональным» — пользователи могут с помощью одного запроса добавить или убрать объекты, наложить фильтры, совместить элементы нескольких изображений.
- Модель научили реставрировать старые или повреждённые снимки и стилизовать фотографии (например, применять стиль аниме, комикса или мультфильма). Появился режим «нейрофотосессии» — можно сгенерировать серию кадров на основе одного, но с другим фоном, одеждой или локацией.
- У Kandinsky 6.0 Image есть встроенный механизм онлайн-поиска по изображениям (Image RAG): если модель не знает, как выглядит объект из запроса, она найдёт референс. Модель работает на архитектуре Mixture of Experts (MoE).
145 комментариев