Seedance 2.0 - лица, русская речь и промты. Как создавать видео нейросетью без ограничений.

ОГЛАВЛЕНИЕ:
- Что такое Seedance 2.0
- Где попробовать Seedance 2.
- Как пользоваться / Как писать промпты
- Готовые промпты
- Как добавить фото реального человека в видео
- Русская речь (как заставить говорить по русски)
Seedance 2.0 от ByteDance - это нейросеть для генерации видео, которая за пару месяцев стала главной темой в мире AI-видео. И не зря: модель реально умеет то, о чем другие генераторы пока только мечтают - стабильные персонажи, живая физика, встроенный звук и работа с референсами. Ниже разбираемся, что в ней особенного, как пользоваться и даем готовые промпты с примерами.

Что такое Seedance 2.0 и почему все о ней говорят

Seedance 2 - это вторая версия видео-модели от ByteDance (те же ребята, что сделали TikTok). Первая версия уже умела неплохо генерировать видео по тексту, но вторая вышла на совершенно другой уровень.

По сути, это первая нейросеть для видео, которая принимает на вход сразу все: текст, картинки (до 9 штук), видеоролики (до 3) и даже аудио (до 3 треков). То есть вы можете загрузить фото человека, видео-референс с нужным движением, музыку - и модель соберет из этого цельный клип.

Если раньше генерация видео нейросетью выглядела как лотерея, то Seedance 2.0 дает ощущение контроля. Вы как режиссер указываете: кто в кадре, что делает, какая камера, какой звук - и получаете результат, близкий к задуманному.

Чем Seedance 2 отличается от других нейросетей для видео

Генераторов видео сейчас много - Sora, Kling, Wan, Veo. Но у каждого свои проблемы. У одних «плывут» лица, у других физика как в мультфильме, третьи не умеют работать со звуком. Seedance 2 закрывает сразу несколько больных мест.

Стабильные персонажи. Лицо не меняется от кадра к кадру. Одежда не мутирует. Если в начале видео у героя синяя куртка - она останется синей до конца. Для AI-видео это до сих пор редкость.

Настоящая физика. Ткань развевается как ткань, вода течет как вода, огонь горит как огонь. Модель не просто рисует картинки - она моделирует, как объекты ведут себя в реальном мире. Походка, жесты, мимика - все выглядит убедительно.

Встроенное аудио. Seedance 2.0 генерирует звук вместе с видео. Не немое кино, а полноценный ролик - с шагами, звуками окружения, даже с речью. Можно также загрузить свою музыку или голос, и модель подстроит видео под звук.

Работа с референсами. Можно отдельно загрузить персонажа, одежду, локацию - и модель соберет все в одну сцену. Не случайная каша, а управляемая сборка.

Кинематографичность. Модель умеет не просто генерировать красивый кадр, а выстраивать сцены с переходами. Можно задать 2-3 шота в одном промпте, и получить мини-историю.

Две модели Seedance 2 - какую выбрать

В Cyber AI доступны сразу две версии Seedance 2:

Seedance 2 Fast - быстрая модель. Оптимальный баланс скорости и качества. Результат приходит за 1-2 минуты. Подходит для экспериментов и быстрых тестов промптов.

Seedance 2 - максимальное качество. Генерация занимает чуть больше времени, но детализация и реалистичность заметно выше. Используйте, когда нужен финальный результат.

Обе модели поддерживают текст, изображения, видео и аудио на входе. Начните с Fast для подбора промпта, потом переключитесь на полную версию для лучшего результата.

Три режима генерации

В настройках Seedance 2 можно выбрать один из трех режимов:

Текст → Видео. Самый простой режим. Пишете описание - получаете видео. Никаких дополнительных файлов не нужно. Идеально для старта.

Кадры → Видео. Загружаете 1-2 изображения как первый и/или последний кадр видео. Модель «оживит» картинку и сделает из нее ролик. Пропорции определяются автоматически из изображения.

Мультимодальный. Самый мощный режим. Можно загрузить до 12 файлов суммарно - изображения, видео и аудио. В промпте используйте ссылки @image1, @video1, @audio1, чтобы модель понимала, какой файл за что отвечает. Например: «@image1 walks through the park while @audio1 plays in the background».

Где попробовать Seedance 2.0 из России

Напрямую из РФ доступ к Seedance 2 получить непросто - модель живет на платформе Dreamina (CapCut), и без средств для смены региона зайти не получится. Но есть способ проще.

В Telegram-боте Cyber AI (@gptcyber_bot) модель Seedance 2.0 уже доступна. Не нужно ничего обходить, не нужно регистрироваться на зарубежных площадках. Открываете Telegram, заходите в бота и генерируете видео прямо в чате.

Формат Telegram объективно проще и быстрее: не нужно держать открытым браузер, результаты приходят прямо в мессенджер, а интерфейс понятен даже если вы впервые пробуете генерацию видео нейросетью.

Как пользоваться Seedance 2.0 - пошаговая инструкция

Вот как создать видео через Cyber AI, шаг за шагом:

  1. Откройте бота @gptcyber_bot в Telegram
  2. В главном меню > Создать видео > выберите раздел с Seedance 2
  3. Нажмите «Задать параметры» - откроется мини-приложение с настройками
  4. Выберите модель: Seedance 2 Fast (быстрая) или Seedance 2 (максимальное качество)
  5. Выберите режим: «Текст → Видео» для генерации по описанию, «Кадры → Видео» если хотите оживить картинку, или «Мультимодальный» для работы с референсами
  6. Настройте длительность (до 15 секунд) и соотношение сторон: 16:9 для горизонтального, 9:16 для вертикального (сторис), 1:1 для квадрата и другие варианты
  7. В поле «Описание видео» вставьте промпт (ниже дадим готовые). Максимум 4000 символов
  8. Если нужно - приложите изображения (JPEG, PNG, WebP до 10MB), видео (MP4, WebM, MOV до 50MB) или аудио (WAV, MP3 до 20MB)
  9. Нажмите «Сохранить» - вернетесь в чат бота
  10. Нажмите «Создать видео» - и через 3-15 минуты получите результат (в час пик дольше)

Совет: чем подробнее промпт, тем лучше результат. Seedance 2 любит конкретику - камера, освещение, действия персонажа, стиль.

Как писать промпты для Seedance 2.0

Секрет хороших результатов - правильная структура промпта. Seedance 2 работает по принципу «режиссерской подсказки»: чем точнее вы описываете сцену, тем ближе результат к задумке.

Формула хорошего промпта:

Субъект + Действие + Камера + Сцена + Стиль + Ограничения

Например: «Девушка в белом платье медленно идет по полю подсолнухов. Камера плавно следует за ней на уровне бедер. Золотой час, мягкий контровой свет. Стиль - кинематографичный. Формат 16:9.»

Оптимальная длина промпта - от 50 до 200 слов (в боте доступно до 4000 символов). Короче - мало деталей. Слишком длинный - модель может запутаться в противоречивых инструкциях.

Несколько советов:

  • Указывайте тип камеры: tracking shot, close-up, POV handheld, drone shot, steadicam
  • Описывайте освещение: golden hour, neon lights, dramatic side-lighting
  • Добавляйте звук: the sound of rain on pavement, quiet jazz music in the background
  • В режиме «Мультимодальный» используйте @image1, @video1, @audio1 для ссылок на загруженные файлы
  • Для 2-3 шотов в одном видео - описывайте каждый через точку или новый абзац

Готовые промпты для Seedance 2.0 с примерами

Ниже - подборка промптов для разных задач. Каждый промпт адаптирован для получения лучших результатов. Скопируйте промпт, вставьте в поле «Описание видео» в настройках бота и нажмите «Создать видео».

1. Кинематографичная сцена

Атмосферный ролик. Показывает как работает Seedance 2 с камерой и сценами (раскадровка) + референс лица

@Image1 is the main character — maintain consistent facial features and body type throughout. Cinematic time-freeze short film, 15 seconds, ultra-realistic, Arri Alexa Mini shooting texture, 50mm lens, natural daylight hard shadows, shallow depth of field. [0:00–0:03] Busy city sidewalk, normal time flow. Steadicam front-facing medium shot tracking: the main character wearing a dark jacket walks confidently through the crowd. Pedestrians walk, check phones, chat; a flock of pigeons flies across the bright sunny sky in the distance. As he walks, he raises his right hand — and snaps his fingers. [0:03–0:06] The instant of the snap — a powerful white spherical shockwave bursts from his fingertips, carrying visible air distortion and light refraction, spreading rapidly in all directions. It sweeps across the ground, kicking up dust and fallen leaves that freeze mid-air instantly. It sweeps over pedestrians — each one freezes mid-stride. It sweeps across the sky — every pigeon locks in a different wing-spread pose, hovering motionless in mid-air. The shockwave ripples a streak of light across distant building windows. After the shockwave vanishes — absolute silence. Subtle time-freeze particles float in the air, gently shimmering in the sunlight. [0:06–0:09] In the silence, only the main character’s footsteps echo crisply. Camera flies backward ahead of him — he walks toward the lens, casually strolling through the frozen crowd, looking around this still world with a smug expression. He looks up and sees a pigeon hovering above, reaches out and gently strokes its feathers. The pigeon doesn’t move at all, like a sculpture, but lets out a deep coo that reverberates through the silence. Satisfied, he keeps walking. [0:09–0:11] The main character walks up to a frozen young woman — she’s wearing a flowing red dress, her long hair caught by the wind and frozen mid-air in an elegant arc, one hand locked in a hair-tucking pose, expression graceful. He stops, hands in pockets, tilts his head and admires her. He comes around to face her, gives a slight nod with a corner smile, and whispers in Russian: “otlichno, siidanse v kiberbote” [0:11–0:15] The main character turns around, pulls a cigarette from his jacket’s inner pocket and places it between his lips, flicks open a lighter — click — lights it, takes a drag and slowly exhales smoke — the smoke is the only thing moving in the entire frozen world. With the cigarette in his mouth he turns to face the camera, smirks, raises his right hand and snaps again — a second shockwave, even more powerful, bursts outward from his fingertips in reverse, carrying air distortion and light refraction, spreading at high speed. Everything it touches instantly unfreezes: pedestrians resume walking, pigeons scatter flapping, the woman in the red dress continues tucking her hair and walks on completely unaware, fallen leaves finally land. City noise naturally returns. The main character, cigarette dangling, calmly turns and walks on. Camera slowly rises and pulls back into an overhead wide shot — his silhouette blends into the city. Fade to black. Sound design: City noise → finger snap triggers a low-frequency explosive shockwave rumble radiating outward from near to far → absolute silence → footsteps echoing → pigeon cooing → whispered Russian “otlichno” → lighter click → inhale and exhale of smoke → second finger snap → stronger reverse shockwave explosion rumble → city noise naturally restored.​​​​​​​​​​​​​​​​

2. Атмосферный ролик с фото первого кадра и через русский промпт. Показывает как Seedance 2 слушается русский язык.

Камера: Sony A7R V или Canon EOS R5 Объектив: Sony FE 85mm f/1.4 GM или Canon RF 50mm f/1.2L USM Съёмка с фиксированной точки, камера не двигается. Кожа: фотореалистичная, видимые поры, натуральная текстура, без сглаживания, без эффекта пластика. Последовательность движений: [0-3 сек] Стоит спокойно, плечи слегка двигаются. [3-6 сек] Медленный плавный поворот головы на 20-30 градусов, волосы мягко двигаются от лёгкого ветра. [6-8 сек] Взгляд возвращается в камеру, лёгкая едва заметная полуулыбка - не широкая улыбка. естественный вес тела и покачивание. приблежение камеры к лицу плавное и затухание кадра в темный. Волосы: лёгкий постоянный ветер с одной стороны, мягкое естественное движение волос на протяжении всего видео. Выражение лица: спокойное, уверенное, минимальная полуулыбка, без зубов. Без эффекта пластика: естественное человеческое движение, реалистичная физика тела, естественный темп ходьбы, тонкая работа мышц, реалистичная динамика ткани. Плавность: без резких движений, плавное ускорение и замедление на каждом движении. Вторичное движение волос после основного - с естественной задержкой. Реалистичный свет: объёмные лучи света, естественный контраст теней, кинематографичная цветокоррекция. Свет стабильный, без мерцания. Фиксация персонажа: одна и та же внешность на протяжении всего видео, одна и та же одежда, стабильные пропорции тела. негативный промт : широкая улыбка, зубы, гладкая кожа, пластиковая кожа, роботизированные движения, резкие рывки, застывшие волосы, скованная поза, движение камеры, мерцание, искажение лица, смена одежды, изменение внешности

3. Экстремальный крупный план с эмоцией

Идеальный пример работы Seedance 2.0 с мимикой и деталями лица. Модель отлично передает эмоции.

Extreme close-up of a young woman's face, eyes slowly opening to reveal reflected golden city lights in her pupils, a single tear rolling down her cheek catching warm light, shallow depth of field with soft bokeh background, intimate and emotional mood, warm amber and cool blue color contrast, gentle ambient music, cinematic quality, 9:16 vertical format

4. Уличный танцевальный баттл

Динамичная сцена с быстрым движением. Seedance 2 хорошо справляется со сложной хореографией и физикой тела. Сгенерил с первого раза, правда не без косяков.

15-second photorealistic street dance battle at night, two dancers on wet pavement under neon signs, thin mist rising from the ground, dynamic tracking camera following each move, colorful neon reflections in puddles, hip-hop beat with bass reverb, fast spins and freezes with realistic fabric movement on baggy clothes, cinematic slow-motion finale, urban energy, 16:9

5. Нуар-сцена под дождем

Стильный ролик в духе фильмов 40-х с элементами киберпанка. Seedance 2 хорошо работает с контрастным освещением.

A detective in a long trench coat walking slowly down a rain-soaked alley at night, neon signs reflecting red and blue streaks in puddles on the ground, steam rising from a manhole, slow dolly shot following from behind, film noir style with high contrast deep shadows, muffled jazz from a nearby bar, footsteps on wet concrete echoing, 1940s meets cyberpunk aesthetic, 16:9 widescreen

6. Редактирование видео поченять стиль или цвета

A person walking through a doorway and emerging into an impossible landscape inspired by M.C. Escher, staircases leading in every direction including upside-down, gravity shifting with each step the person takes, dreamlike floating dust particles catching shafts of golden light, ethereal and disorienting atmosphere, smooth steady tracking shot following the walker, ambient mysterious soundtrack, soft pastel color palette, 16:9
доступ в агрегатор нейросетей

Лайфхаки для Seedance 2

Как добавить фото реального человека в видео

Если вы попробуете просто загрузить фото реального человека в Seedance 2 напрямую - скорее всего, модель откажет. Это связано с тем, что у нейросети есть встроенная модерация на реальные лица.

Но есть простой способ обойти это ограничение - нужно сначала создать «исходник» через быструю ссылку (автогенерацию). Вот как это работает:

  1. Перейдите по специальной ссылке автогенерации (она ниже)
  2. Бот предложит вам загрузить фото - прикрепите фото человека, которого хотите использовать как референс
  3. Бот создаст «исходник» - это обработанное изображение, которое уже проходит модерацию Seedance 2 (90% случаев)
  4. Полученный исходник используйте в режиме «Кадры → Видео» или «Мультимодальный» - загрузите его как обычное изображение
  5. В промпте опишите, что должен делать персонаж: ходить, говорить, жестикулировать - модель «оживит» фото

Таким образом, вы подаете на вход не просто фотографию из галереи, а специально подготовленный референс. Модерация его пропускает, а Seedance 2 использует лицо и внешность для генерации видео.

Создать свой референс для Seedance2: TG или MAX

Как сделать, чтобы персонаж говорил на русском языке

Seedance 2 умеет генерировать видео с речью - персонаж может произносить фразы. Но по умолчанию модель «говорит» на английском. Как заставить ее говорить по-русски?

Все просто. Промпт пишете на английском языке (так модель лучше понимает инструкции), но в самом промпте указываете, что персонаж говорит на русском. А саму русскую фразу пишете транслитом - латинскими буквами.

Вот пример:

A young woman sitting at a desk, looking at camera, smiling warmly and speaking in Russian language, she says: "Privet, menya zovut Anna, i segodnya ya rasskazhu vam kak rabotat s neyrosetyami", soft natural lighting, medium close-up shot, professional vlog style, 16:9

Обратите внимание: фраза «Привет, меня зовут Анна, и сегодня я расскажу вам как работать с нейросетями» написана транслитом: "Privet, menya zovut Anna, i segodnya ya rasskazhu vam kak rabotat s neyrosetyami".

Почему это работает: модель видит латинские буквы (которые она хорошо понимает), но фонетически воспроизводит русскую речь. Результат - персонаж реально говорит по-русски с понятным произношением.

Еще пара примеров фраз транслитом:

  • "Dobroye utro, kak vashi dela" - Доброе утро, как ваши дела
  • "Spasibo za podpisku na kanal" - Спасибо за подписку на канал
  • "Eto video sdelano s pomoshchyu neyroseeti" - Это видео сделано с помощью нейросети

Советы для лучшего результата: пишите фразы короткими (до 10-15 слов), избегайте сложных слов и добавляйте в промпт описание «speaking in Russian language» или «talking in Russian».

Частые ошибки при работе с Seedance 2

Даже с хорошим промптом можно получить не то, что хотелось. Вот типичные проблемы и как их решить.

Промпт слишком короткий. Если написать «девушка танцует» - модель додумает все сама, и результат будет случайным. Добавляйте детали: где, как, какой стиль, какая камера.

Слишком много шотов. Seedance 2 хорошо справляется с 2-3 сменами сцены в одном ролике. Если указать 5+ шотов, видео может получиться хаотичным. Лучше делить на несколько генераций.

Конфликтующие инструкции. «Ночная сцена с ярким солнечным светом» - модель не поймет, что вы хотите. Следите, чтобы описания не противоречили друг другу.

Не тот формат. Не забывайте выбирать соотношение сторон в настройках бота: 16:9 для горизонтальных видео, 9:16 для вертикальных (сторис, рилс), 1:1 для квадрата. Также можно выбрать 4:3, 3:4 или 21:9 для кинематографичного широкого формата.

Не та модель. Seedance 2 Fast - для экспериментов и подбора промпта. Seedance 2 - для финального результата. Не тратьте время на полную модель, пока не подобрали хороший промпт.

FAQ

Что такое Seedance 2 и чем она отличается от первой версии?

Seedance 2.0 - это обновленная нейросеть для генерации видео от ByteDance. Главные отличия: мультимодальный вход (текст + фото + видео + аудио), встроенная генерация звука, улучшенная физика и стабильность персонажей. Доступны две версии - Fast (быстрая) и полная (максимальное качество).

Какой длины получается видео?

В настройках можно выбрать длительность до 15 секунд. Для более длинных видео можно комбинировать несколько генераций, используя режим «Кадры → Видео» с последним кадром предыдущего ролика.

Можно ли загрузить свое фото и получить видео с собой?

Да. Но напрямую фото реального человека может не пройти модерацию. Используйте лайфхак с автогенерацией (описан выше в разделе «Лайфхаки») - создайте исходник через быструю ссылку, а затем используйте его в режиме «Кадры → Видео» или «Мультимодальный».

Нужны ли знания английского для промптов?

Промпты лучше писать на английском - модель лучше понимает детали, но можно писать по русски.

Можно ли сделать видео с русской речью?

Да! Пишите промпт на английском, но укажите, что персонаж говорит по-русски. Саму фразу напишите транслитом (латинскими буквами). Подробная инструкция с примерами - в разделе «Лайфхаки» выше.

Seedance 2 лучше чем Sora или Kling?

У каждой модели свои сильные стороны. Seedance 2.0 выделяется встроенным аудио, работой с референсами и стабильностью персонажей. Sora сильна в креативных абстрактных сценах, Kling - в быстрой генерации. Лучше попробовать и сравнить на своих задачах.

Что дальше

Seedance 2.0 - это один из тех моментов, когда генерация видео нейросетью делает заметный шаг вперед. Стабильные персонажи, живой звук, реальная физика, работа с референсами - все это уже можно попробовать прямо сейчас, без сложных настроек и регистраций на зарубежных сайтах.

Скопируйте любой промпт из статьи, откройте бота в Telegram и посмотрите результат своими глазами. А если придумаете свой крутой промпт - делитесь в комментариях.

1
Начать дискуссию