Один выпуск подкаста = транскрипт, субтитры и посты за 5 минут нейросетью
Бизнес-консультация. Мы разбираем рабочие процессы, говорим про фокус и нагрузку. Ближе к концу Сергей (не буду уточнять фамилию, но если смотрели российский сериал "Триггер", то консультировал именно он) - спрашивает: "Ты же следишь за нейросетями, да?"
Слежу.
"Вот, посмотри." Он показывает Telegram-бот, который расшифровывает его подкасты. Сергей ведет несколько, записывает регулярно - разговоры про психологию, бизнес, принятие решений. Часа по полтора.
Я записал.
Потом вспомнил, что он даже как-то спрашивал в общей ТГ-группе через свою помощницу про то, чем, собственно, быстрее всего транскрибировать его подкаст и быстро. И нужно было что-то максимально простое и именно для деловой переписки в мессенджере, т.к. Сергей - человек публичный и занятой. Что, понятное дело, конкретно про время. А точнее - про его нехватку.
И теперь полез смотреть сам. Вот что там.
Контекст - почему подкастеру нужен текст
У Сергея стандартная проблема любого, кто ведет длинный аудиоформат. Запись есть. Монтажа нет (или минимум). Публикация на платформе - есть. А дальше?
Дальше - есть нюансы. Потому что текстовая аудитория не слушает. Потому что субтитры делать - это еще час работы на час видео. Потому что пост в Telegram из полуторачасового разговора руками не напишешь каждую неделю.
Аутсорс решает, но медленно и дорого: расшифровка стоит от 400 рублей за минуту, итого 35-40 тысяч за один длинный выпуск. На постоянной основе это либо бюджет медиа, либо нет.
Подкаст - это плотный контент. Умный разговор на полтора часа содержит материала на неделю постов, статью и конспект. Если этот материал не оцифрован - он существует только для тех, кто дослушал до конца.
Да, небольшая ремарка. У Сергея есть помощница и медиа-команда. Но есть задачи, которые делегировать дороже, чем сделать самому: объяснить, поставить, проверить - и вот уже полчаса ушло на то, что решается за три минуты. Он просто нашел вариант, где человека в цепочке нет вообще.
@WhisperSummaryAI_bot: что внутри
Сервис заточен под контент-производство. Не просто "дали транскрипт" - а транскрипт, выжимка и SRT-файл субтитров из одного запроса. Все это прямо в чате, без переключения в браузер.
Принцип прост: отправляете ссылку или файл - получаете три вещи. Транскрипт с таймкодами и разбивкой по спикерам. Выжимку - не нарезку цитат, а осмысленный пересказ, который читается как редакторский конспект. И SRT - файл субтитров, готовый к загрузке в YouTube Studio, CapCut, Premiere или DaVinci без конвертации.
SRT, кстати, это отдельная история. Платформы очень даже читают субтитры при ранжировании. Алгоритм понимает содержимое видео, а не только описание и теги. Для нишевых тем разница в органическом охвате ощутима - и именно поэтому большинство серьезных каналов добавляет субтитры к каждому ролику.
Принимает: YouTube, VK, Rutube, Instagram, TikTok, Facebook, Twitter/X, Vimeo, Reddit - по ссылке, без скачивания. Файлами - MP3, MP4, WAV, OGG, M4A и другие форматы. До 6 часов за один запрос. Голосовые сообщения - пересылаете напрямую.
Что делает блогер с помощью этого ТГ-бота и записи выпуска:
- Берет ссылку - подкасты выложены на YouTube и ВК.
- Вставляет в бот.
- Через несколько минут получает транскрипт и выжимку.
- Выжимка идет в Telegram-канал как конспект выпуска.
- Транскрипт - редактору, который режет на посты
Все. Один файл на входе, три-четыре формата на выходе. Раньше это стоило времени или денег. Теперь - несколько минут и клик.
Меня прямо очень зацепил формат выжимки, если честно. Это не список фраз, вырванных из контекста, а связный текст про суть разговора. Читаешь - понимаешь, о чем был выпуск. Для подкаста про психологию это максимально важно. Тезисы там нелинейные, и нарезка цитат убивает смысл.
Деньги
Оплатить можно картой российского или иностранного банка.
Тарифы по минутам аудио:
- Безлимит на 7 дней - 249 рублей
- Безлимит на 30 дней - 549 рублей
- Безлимит на 6 месяцев - 2499 рублей
Двенадчать часов аудио - и всего за 249 рублей. Транскрипт, выжимка и SRT в одном проходе.
Я проверил сам. Качество расшифровки на русском - очень даже достойное. Текст читается без вопросов. Голосовые принял сразу.
50 000 ежедневных пользователей и 250 000+ часов обработанного контента - не маркетинговая цифра, а знак того, что схема "записал → получил текст" работает и ее используют регулярно.