TG Telegram Group & Channel
Python RU | United States America (US)
Create: Update:

🗣 Мини-скрипт: говори по-русски своим клонированным голосом (Coqui TTS)

Вот минимальный Python-скрипт на базе модели xtts_v2 от Coqui, который позволяет ввести текст на русском языке и получить аудиофайл с твоим клонированным голосом.

📦 Перед запуском установи зависимости:


pip install TTS soundfile torchaudio


📄 Сохрани этот код как russian_voice_clone.py и запусти:


from TTS.tts.configs.xtts_config import XttsConfig
from TTS.tts.models.xtts import Xtts

# 📁 Путь к твоему голосовому файлу
voice_sample_path = "your_voice.wav"

# 📝 Ввод текста
text = input("Введите текст на русском: ")

# ⚙️ Загрузка модели
config = XttsConfig()
model = Xtts.init_from_config(config)
model.load_checkpoint("tts_models/multilingual/multi-dataset/xtts_v2")

# 🎤 Создание эмбеддинга
speaker_embedding = model.get_speaker_embedding(voice_sample_path)

# 🔊 Синтез речи
output_wav = model.tts(text, speaker_embedding=speaker_embedding)

# 💾 Сохранение
model.save_wav(output_wav, "output_russian.wav")
print(" Аудио сохранено как output_russian.wav")


📌 Убедись, что:
- Файл your_voice.wav формата: .wav, 16 кГц, моно.
- Можно использовать речь любой длины (желательно от 1 минуты).
- Вводи любой текст на русском — результат будет с твоим голосом.

🗣 Мини-скрипт: говори по-русски своим клонированным голосом (Coqui TTS)

Вот минимальный Python-скрипт на базе модели xtts_v2 от Coqui, который позволяет ввести текст на русском языке и получить аудиофайл с твоим клонированным голосом.

📦 Перед запуском установи зависимости:


pip install TTS soundfile torchaudio


📄 Сохрани этот код как russian_voice_clone.py и запусти:


from TTS.tts.configs.xtts_config import XttsConfig
from TTS.tts.models.xtts import Xtts

# 📁 Путь к твоему голосовому файлу
voice_sample_path = "your_voice.wav"

# 📝 Ввод текста
text = input("Введите текст на русском: ")

# ⚙️ Загрузка модели
config = XttsConfig()
model = Xtts.init_from_config(config)
model.load_checkpoint("tts_models/multilingual/multi-dataset/xtts_v2")

# 🎤 Создание эмбеддинга
speaker_embedding = model.get_speaker_embedding(voice_sample_path)

# 🔊 Синтез речи
output_wav = model.tts(text, speaker_embedding=speaker_embedding)

# 💾 Сохранение
model.save_wav(output_wav, "output_russian.wav")
print(" Аудио сохранено как output_russian.wav")


📌 Убедись, что:
- Файл your_voice.wav формата: .wav, 16 кГц, моно.
- Можно использовать речь любой длины (желательно от 1 минуты).
- Вводи любой текст на русском — результат будет с твоим голосом.


>>Click here to continue<<

Python RU




Share with your best friend
VIEW MORE

United States America Popular Telegram Group (US)