Dolphin — это многоязычная, многозадачная модель ASR, разработанная в рамках сотрудничества Dataocean AI и Университета Цинхуа. Она поддерживает 40 восточных языков Восточной Азии, Южной Азии, Юго-Восточной Азии и Ближнего Востока, а также 22 китайских диалекта. Она обучена на более чем 210 000 часах данных, включая как собственные наборы данных DataoceanAI, так и наборы данных с открытым исходным кодом. Модель может выполнять распознавание речи, обнаружение голосовой активности (VAD), сегментацию и идентификацию языка (LID).
https://github.com/dataoceanai/dolphin
>>Click here to continue<<
