🔊 В опенсорс вышел самый лёгкий и доступный генератор речи - MOSS-TTS-Nano работает локально на любом процессоре даже без видеокарты.
Ультралёгкий TTS, который можно гонять хоть на тостере - MOSS-TTS.
Это не «демка на поиграться», а нормальный инструмент: запускается на обычном 4-ядерном CPU, тянется даже на уровне Raspberry Pi и при этом выдаёт живую речь без ощутимой задержки.
Модель крошечная - около 100 млн параметров, но звук на уровне: до 48 кГц и вполне чистая озвучка.
Лучше всего справляется с английским, но русский тоже поддерживает.
Умеет не только короткие фразы. Спокойно читает длинные тексты и может клонировать голос, что открывает кучу сценариев — от ботов до локальных ассистентов.
Фактически это TTS, который не требует ни облака, ни GPU, ни сложной инфраструктуры. Запустил и используешь.
https://github.com/OpenMOSS/MOSS-TTS-Nano
Демо: https://huggingface.co/spaces/OpenMOSS-Team/MOSS-TTS-Nano
Показываю на практике, как выжимать максимум из Claude и других ИИ без воды и теории. Разбираю реальные кейсы, даю гайды и объясняю на пальцах, как это применять у себя. Если Telegram не работает — дублирую в Max.
: