🔊 В опенсорс вышел самый лёгкий и доступный генератор речи - MOSS-TTS-Nano работает локально на любом процессоре даже без видеокарты.

Ультралёгкий TTS, который можно гонять хоть на тостере - MOSS-TTS.

Это не «демка на поиграться», а нормальный инструмент: запускается на обычном 4-ядерном CPU, тянется даже на уровне Raspberry Pi и при этом выдаёт живую речь без ощутимой задержки.

Модель крошечная - около 100 млн параметров, но звук на уровне: до 48 кГц и вполне чистая озвучка.

Лучше всего справляется с английским, но русский тоже поддерживает.

Умеет не только короткие фразы. Спокойно читает длинные тексты и может клонировать голос, что открывает кучу сценариев — от ботов до локальных ассистентов.

Фактически это TTS, который не требует ни облака, ни GPU, ни сложной инфраструктуры. Запустил и используешь.

https://github.com/OpenMOSS/MOSS-TTS-Nano

Демо: https://huggingface.co/spaces/OpenMOSS-Team/MOSS-TTS-Nano

Показываю на практике, как выжимать максимум из Claude и других ИИ без воды и теории. Разбираю реальные кейсы, даю гайды и объясняю на пальцах, как это применять у себя. Если Telegram не работает — дублирую в Max.

:

23
15 комментариев