Seedance 2.0: Опыт рефлексирующего аналитика
Прилагательные в промпте — это балласт. Слова вроде aesthetic, graceful, cinematic почти всегда дают один и тот же эффект: сцена теряет логику, картинка остаётся аккуратной, но фейлы вылезают в каждом кадре.
Seedance 2.0 даёт предсказуемый результат не тогда, когда промт «красивый», а когда сцена технически собрана: заданы ограничения, есть понятное действие, зафиксирован свет и прописана логика камеры. «Физика» здесь — это не абстракция, а конкретное поведение и движение, заданные явно. Чем меньше двусмысленности в сцене, тем стабильнее результат. В этот момент промт — уже не текст, а техническая спецификация.
Разделяйте и властвуй
Одна из базовых причин, почему сцена теряет управляемость — смешивание ролей. Когда один референс одновременно отвечает за визуальную идентичность, среду и динамику, модель перестаёт разделять, где заканчивается объект и начинается пространство. В результате плывут признаки, ломается геометрия, а движение вступает в конфликт с композицией. Рабочий принцип простой: один референс — одна функция. Чем сегментированнее зона ответственности, тем стабильнее результат.
Распределение ролей:
- изображения (@Image) фиксируют статику — идентичность персонажа (лицо, пропорции, детали), структуру среды и расположение объектов в сцене;
- видео (@Video) задаёт поведение — движение объектов и персонажа, работу камеры, ритм, монтаж и визуальные эффекты, которые могут воспроизводиться автоматически.
Если одной роли становится недостаточно, её не расширяют, а разделяют на несколько независимых референсов.
Важно про видео-референсы: они передают не только движение, но и характер сцены — камеру, монтаж и эффекты. Эти эффекты могут воспроизводиться автоматически, даже если вы их не закладывали, поэтому их либо используют осознанно, либо ограничивают.
Та же логика работает и на уровне кадра (shot). Если в одном кадре одновременно заданы несколько равнозначных задач — персонаж, среда, движение и вторичные элементы — модель теряет приоритеты, и сцена становится нестабильной. На практике кадр держится на одном основном фокусе и понятной последовательности действий. В каждый момент есть главный акцент — движение, свет, объект или пространство — а всё остальное подчинено ему. Если внутри кадра возникает конкуренция за внимание, сцена начинает «ехать»: движения теряются, акценты смещаются, поведение становится непредсказуемым.
Чем яснее фокус и последовательность, тем устойчивее собирается сцена.
Свет, физика, но ещё не мотор
Если в промпте не заданы параметры среды, модель начинает достраивать их сама. В этот момент сцена теряет стабильность: меняется освещение, расстояние между объектами прыгает, а перспектива ломается.
Свет как инструмент фиксации формы
В Seedance 2.0 свет — это не «атмосфера», а способ сделать объекты различимыми: он отделяет персонажа от фона и удерживает объём. Если параметры света не заданы явно, модель будет пересобирать освещение в каждом кадре. Что фиксируем:
- single warm key light from frame-left, hard shadows — задаёт объём и чёткие границы;
- two light sources: cold top light + warm backlight — отделяет объект от фона;
- high contrast lighting, deep shadows — делает форму читаемой, убирает «плоскость»;
- stable lighting, no light source drift — сохраняет свет стабильным между кадрами.
Физика
Физика в промте — это не реализм, а предсказуемость поведения. Если поведение материалов не описано, модель начинает интерпретировать его сама, и сцена становится нестабильной.
Отдельно это критично для сложных взаимодействий — например, сцен с драками или активным контактом. В таких сценах действие нужно задавать последовательно: движение → точка контакта → реакция. Если этого нет, модель теряет структуру: движения становятся «смазанными», тела деформируются, контакт не считывается.
Параметры контроля:
- Материалы: fabric reacts naturally to movement, no stiffness — ткань двигается вместе с телом, не «ломается» и не замирает;
- Анатомия: hair follows head motion, no independent floating — волосы двигаются вместе с головой, не «висят» и не живут отдельно;
- Статика среды: fixed room layout, no object displacement — объекты остаются на месте и не «переезжают»;
- Отражения: reflections stable, no distortion — отражения не «плывут» при движении;
- Контакт: distinct limb separation, no limb merging during contact — части тела не «слипаются»;
- Точки контакта: fixed contact points, visible physical impact — взаимодействие происходит в конкретной точке;
- Инерция: weight transfer visible, realistic body tension — видно перенос веса и напряжение;
- Реакция материалов: clothing compression at contact points, no texture bleeding — ткань сжимается в точке давления, не «протекает».
Камера: управление вниманием
Камера должна задаваться через конкретные параметры: ракурс, дистанцию и движение. Общие слова вроде cinematic не задают поведение камеры. Пресеты для управления фокусом:
- low angle, medium shot, slow push-in — делает персонажа доминирующим и удерживает внимание на нём;
- close-up, eye-level, static camera — фиксирует состояние;
- wide shot, static camera — показывает пространство;
- handheld, slight shake, fast push-in — создаёт напряжение;
- smooth orbit around subject — показывает форму объекта.
Важно: параметры камеры должны быть согласованы. Если ракурс, дистанция и движение противоречат друг другу, модель начинает «прыгать» между состояниями, пытаясь угодить всем командам сразу.
Я против безопасного промта
Промпты, прогнанные через ChatGPT и аналоги, теряют точность исполнения. Происходит деградация промта: конкретные действия заменяются безопасными формулировками. Вместо «ударил» появляется «коснулся», вместо «врезал» — «взаимодействует». В этот момент действие перестаёт считываться. Модель исполняет текст буквально. Если в формулировке нет амплитуды, импульса и кинетики, она их не добавит: движение становится вялым, контакт — неубедительным, сцена теряет структуру.
На практике это не переписывание «с нуля», а итеративный процесс: прогнал — вычитал — усилил вручную. Ты читаешь результат, видишь «вату» вместо действия и возвращаешь в текст конкретику.
Главный вопрос: откуда брать формулировки, которые заставят Seedance 2.0 выдать динамику?
Рабочие формулировки не экстрагируют из пустоты — их собирают из источников с готовой физикой: референс-видео, раскадровок экшен-сцен и описаний реального движения.
Усатые лайфхаки
1. Привязка идентичности
Проблема: уникальные признаки персонажа не удерживаются и меняются от кадра к кадру.
Решение: фиксировать их в каждом промте как константы (heterochromia, freckles, scars).
2. Инородные объекты как автономия
Проблема: маски, крылья и аксессуары «сливаются» с телом и деформируются.
Решение: задавать их как отдельные объекты с запретом на слияние и трансформации (mask as separate object, no fusion with skin; wings attached to back, no transformation).
3. Обход ограничений через storyboard
Проблема: при ограничениях платформы на количество референсов с лицом сцена не проходит.
Решение: разбивать на storyboard (4–6 кадров) и передавать идентичность через несколько сцен.
4. Потеря деталей на дальних планах
Проблема: на wide shot лицо и мелкие текстуры превращаются в «мыло».
Решение: генерировать такие элементы отдельно и интегрировать, а не пытаться дожать один промт.
5. Контроль текстуры кожи
Проблема: модель сглаживает лицо и убирает микродетали.
Решение: добавлять skin pores, subtle imperfections, raw photo texture.
Контроль материалов Проблема: материалы смешиваются в одно пятно. Решение: задавать их явно (layered silk, leather straps).
Контроль глаз Проблема: цвет и детализация «съедаются» светом. Решение: фиксировать блик (specular highlight in both eyes).
Примеры промтов
1. Падение_в_пустыне_трансформация_металл
Промт перегружен действиями — при переиспользовании упрощайте сцену и убирайте конфликтующие движения.
2. Дуэль_на_берегу_два_существа
Промт перегружен действиями и камерой — при переиспользовании упрощайте шоты и убирайте конкурирующие движения.
3. Волк_в_тени_комната_v1
Сцена построена на проявлении существа через среду комнаты