Мой ИИ-двойник снимает Reels вместо меня. 4 нейросети, 20 минут, ноль съёмок — показываю пайплайн
Я не снимаюсь для Reels. Инст при этом этом продолжает жить. Ниже мой последний ролик — целиком создан нейросетями. Без камеры, без оператора, без монтажёра.
Не отличить от обычного Reels? В этом и фокус!
Ниже — полный пайплайн: 4 инструмента, 3 промта, ссылки на всё. Повторите за один вечер — даже если никогда не работали с нейросетями.
Суть метода — в одной схеме
Прежде чем нырять в детали — вот как устроен весь процесс:
1) Ваше фото → NanoBanana (генерирует фотосессию)
2) Ваш текст и голос → ElevenLabs (клонирует голос)
3) Результат двух первых шагов → HeyGen (оживляет фото: губы двигаются, глаза моргают)
4) Финальное видео → Captions AI (субтитры, зум, монтаж)
Четыре шага. На каждом — одна нейросеть. На выходе — ролик, который выглядит как настоящая съёмка.
Шаг 1. Фотосессия без фотографа — NanoBanana
Задача: получить фотореалистичные изображения с вашим лицом в нужном ракурсе, стиле и освещении.
Почему не Midjourney? Для этой задачи NanoBanana лучше удерживает идентичность лица при работе с двумя референсами — ваше фото + стиль одежды. Midjourney часто «усредняет» лицо.
Как это работает?
Вы отправляете боту два фото:
- Фото 1 — ваше лицо (identity)
- Фото 2 — образ/стиль (одежда, аксессуары)
Плюс промт, который объясняет: «возьми лицо с первой фотки, стиль со второй, сгенерируй результат».
Ключевая строка, без которой ничего не работает — вставляю в каждый промт:
Без неё NanoBanana смешивает лица и стили в непредсказуемую кашу. С ней — чёткое разделение: лицо ваше, стиль — с референса.
3 промта под разные ракурсы Reels
Я не писала промты вручную — попросила Claude сгенерировать 3 варианта под типичные ракурсы для Reels. Каждый оптимизирован под вертикальный формат 9:16.
Промт 1 — «Фронтальная камера, крупный план»
> Имитирует селфи с фронталки смартфона. Лицо занимает 65% кадра, тёплый рассеянный свет, мягкий размытый фон. Идеален для talking head Reels.
Что можно менять? Описание фона (сейчас — порог американского дома), направление света, выражение лица.
Промт 2 — «За столом, уровень глаз»
> Камера на уровне глаз, как будто телефон стоит на столе напротив. Оконный свет слева, минимальное присутствие стола в кадре. Подходит для «экспертных» Reels.
Что можно менять? Тип стола, освещение, наличие кофе/ноутбука в кадре.
Промт 3 — «Крыльцо, золотой час»
> Мягкий закатный свет, уверенный расслабленный взгляд в камеру, уютная атмосфера. Для lifestyle-контента.
Что можно менять? Локация (крыльцо / балкон / парк), время суток.
Шаг 2. Клонируем голос — ElevenLabs
Задача: создать цифровую копию вашего голоса, которая будет озвучивать Reels.
ElevenLabs — сервис синтеза речи. Есть бесплатные стартовые токены.
Как клонировать голос?
- Зарегистрируйтесь, перейдите в раздел Voice Cloning.
- Загрузите запись вашего голоса (30–60 секунд, чистая речь, без шумов). ElevenLabs создаст клон за ~2 минуты.
- Теперь вводите любой текст — сервис озвучит его вашим голосом!
Важный нюанс: на английском ElevenLabs звучит почти неотличимо от оригинала. На русском — заметен лёгкий «цифровой» привкус. Для Reels в ленте, где звук идёт через динамик телефона — разница незаметна. Для подкаста — будет слышно.
Шаг 3. Оживляем аватар — HeyGen
Задача: объединить фото из шага 1 и аудио из шага 2 в видео, где аватар говорит вашим голосом.
HeyGen — сервис для анимации лица. Я пользуюсь этим инструментом в агрегаторе.
Что происходит под капотом?
HeyGen берёт статичное фото и «оживляет» его:
- Губы двигаются синхронно с аудиодорожкой
- Глаза моргают с естественной частотой
- Голова слегка покачивается — микродвижения добавляют реализм
Загружаете видео из первого шага (рекомендую промт 1 — фронтальный ракурс даёт лучший результат) и аудио-дорожку из второго шага!
Результат генерации:
Синхронизация губ: 8/10 — при быстром просмотре в ленте не отличить
Моргание: 7/10— естественно, но чуть реже, чем у живого человека
Мимика: 6/10— лоб и щёки почти не двигаются
В ленте выглядит, как реальная съёмка. При замедленном разборе — видна статичность шеи и плеч.
Это уже рабочий Reels. Но без монтажа, субтитров и эффектов он выглядит сыро. Поэтому — нам нужен ещё 1 шаг!
Шаг 4. Автомонтаж за 1 минуту — Captions AI
Задача: превратить «сырое» видео в готовый Reels с субтитрами, зум-эффектами и переходами.
Я тестировала два инструмента:
Submagic (только платная версия)
- Субтитры : 10/10
- Стили монтажа: 7/10 (базовые)
- Зум-переходы: 6/10 (базовые)
Caption AI (есть бесплатные попытки)
- Субтитры : 10/10
- Стили монтажа: 9/10 (много нестандартных шаблонов)
- Зум-переходы: 8/10 (больше шаблонов)
Процесс
- Загрузите видео из шага 3
- Выберите стиль или загрузите референс
- Дождитесь обработки (~60 секунд)
- Скачайте готовый Reels
Финальный результат (в начале статьи) собран без камеры, без студии, без ручного монтажа. 4 нейросети, 20 минут!
Благодарю за уделённое время, дорогой читатель! Если ты ещё не подписан на мой ТГ-канал, то самое время это сделать LEYA | AI-GUIDE