Модель разработали в Пекинской академии ИИ. Для интерпретации промпта используют Qwen3, для синтеза аудио — сервис ElevenLabs. Далее специальная нейросеть собирает все в одно видео.
По качеству картинки MTVCraft, конечно, не может соперничать с Veo 3, но тренд явный: скоро «немых» ИИ-генераторов не останется.
>>Click here to continue<<