Нейросети Яндекса теперь сохраняют тембр и интонации при переводе видео 🎙
Раньше Браузер переводил речь с видео, подбирая голос из базы, что иногда звучало неестественно. Теперь новая нейросеть анализирует оригинальную аудиодорожку — голос, тембр, интонации — и герой говорит по-русски, как на родном языке.
Яндекс разработал систему генеративного синтеза речи: модель создаёт голос, сохраняя уникальные черты. Биометрическая модель, обученная на открытых аудиозаписях, удерживает тембр, единая фонемная система обеспечивает точное произношение. Звук очищается денойзингом, а инференс ускорен для работы в реальном времени.
#Яндекс #AI #переводвидео #нейросети
>>Click here to continue<<