Будни разметчиков: как мы помогли Алисе AI лучше редактировать и оживлять изображения

С помощью Алисы AI теперь можно легко оживить фото или отредактировать картинку. Данные для запуска этих опций подготовили в Яндекс Крауде. Расскажем, как происходил процесс.

Будни разметчиков: как мы помогли Алисе AI лучше редактировать и оживлять изображения

Алиса, оживи картинку

В октябре 2025 года Яндекс представил Алису AI, в чате с которой можно решить множество задач: разобраться в сложной теме, проверить орфографию или найти фильм под настроение. Только в 2025 году Алиса AI обработала в чате более 2,9 млрд запросов.

У Алисы AI теперь есть режим «Редактирование изображений». Прямо в чате можно изменять фотографии и картинки по готовым шаблонам — например, переодеть персонажа в смокинг или платье. Скоро можно будет использовать свои запросы (промпты), чтобы редактировать фон, одежду и причёски персонажей, добавлять элементы декора, применять стили и фильтры.

Также Алиса AI теперь умеет оживлять изображения. Функция работает в «Студии», которая есть в приложениях «Алиса AI», «Яндекс» и «Яндекс Браузер».

Чтобы Алиса AI корректно редактировала и оживляла изображения, нужно было показать ей, как это делать правильно. Для этого нужно было оценить качество множества сгенерированных изображений. Как раз с этим помогли разметчики Яндекс Крауда.

Что такое разметка данных?

Разметка данных — это процесс добавления специальных меток к сырым данным (изображениям, текстам, аудио и т. д.), чтобы показать модели, что именно в них важно. Например, на фото с животными размечают контуры кошек и собак и подписывают: «кошка», «собака». Разметка нужна для дальнейшего обучения ML-моделей: она даёт алгоритму «ответы» — на их основе модель учится самостоятельно распознавать объекты, категории или закономерности в новых, неразмеченных данных.

Как делали разметку для оживления фотографий

Алиса AI оживляет статичные изображения — фото, иллюстрации из учебников, логотипы, афиши, рисунки, картинки. Вот как это выглядит:

Для оживления изображения команде Алисы AI нужно было научить модель верно отображать движение объектов, без скачков и ряби. При этом фон должен оставаться статичным и реалистичным. Чтобы модель справлялась с этим, разметчики Яндекс Крауда оценили тысячи примеров оживления.

Аналитики Алисы AI отправляли на разметку изображения, сгенерированные несколькими версиями моделей. Специалисты по разметке оценивали качество генерации на внутренней платформе Яндекс Крауда. На экране отображалось фото с двумя примерами оживления. Разметчики сравнивали пару роликов по трём аспектам:

  1. Соответствие запросу
  2. Движение объектов
  3. Фон

Дополнительно разметчики указывали, какой из роликов им субъективно понравился больше.

Таким образом разметили более 15 тысяч пар видео. Эти данные помогли аналитикам и разработчикам Алисы AI понять, как лучше дообучать модель. Теперь Алиса AI комбинирует в кадре физически правдоподобное поведение объектов с сохранением стиля исходного изображения.

Как проходила разметка по редактированию изображений

Сейчас по готовым шаблонам в чате с Алисой AI можно легко поменять цвет волос или одежду человека на фото. Но за этой простотой тоже стоит тщательная работа разметчиков.

Будни разметчиков: как мы помогли Алисе AI лучше редактировать и оживлять изображения
Будни разметчиков: как мы помогли Алисе AI лучше редактировать и оживлять изображения

Что мы хотим увидеть, когда просим Алису AI отредактировать изображение? Чтобы она сохранила черты объекта и не меняла те элементы, которые должны остаться в изначальном виде. Если после редактирования изменилось не только то, о чем мы просили (например, цвет волос), но и лицо персонажа стало другим или появились ненужные детали, значит, модель не справилась.

Чтобы модель выдавала точный результат, разметку делали с большим количеством параметров. Стандартно для разметки картинок оценивали эстетичность, комплексность изображения, соответствие запросу, наличие дефектов. В дополнение использовали несколько аспектов именно для редактирования изображений, например, оценивали сохранение черт — узнаваемость персонажа при изменении изображения по шаблону.

Так могло выглядеть задание разметчика на оценку редактирования по шаблону:

Будни разметчиков: как мы помогли Алисе AI лучше редактировать и оживлять изображения

Разметчик оценивал качество финальной генерации по нескольким аспектам и давал общую оценку:

Будни разметчиков: как мы помогли Алисе AI лучше редактировать и оживлять изображения

Для появления функции редактирования фото специалисты Яндекс Крауда разметили более 887 тысяч картинок.

Сейчас наши разметчики продолжают работу над проектом, чтобы Алиса AI научилась редактировать картинки не только по шаблону, но и по запросу пользователя.

______________________________

Разметка данных — только одно из направлений удалённой работы в Яндекс Крауде. Интересными задачами в компании занимаются более 30 тысяч сотрудников из 1000 городов. Среди них — AI-тренеры, специалисты поддержки, редакторы, дизайнеры, аналитики и другие эксперты. Выбрать вакансию по профилю, интересам и графику можно на официальном сайте Яндекс Крауда.

3
1 комментарий