TG Telegram Group & Channel
Big data world | United States America (US)
Create: Update:

MINT-1T: мультимодальный чередующийся набор данных объемом один триллион токенов.

Мультимодальные чередующиеся наборы данных, включающие чередующиеся последовательности изображений и текста свободной формы, имеют решающее значение для обучения передовых больших мультимодальных моделей (LMM). Несмотря на быстрое развитие LMM с открытым исходным кодом, по-прежнему наблюдается выраженный дефицит крупномасштабных разнообразных мультимодальных чередующихся наборов данных с открытым исходным кодом. В ответ на это мы представляем MINT-1T, самый обширный и разнообразный набор данных Multimodal INTerleaved с открытым исходным кодом на сегодняшний день.

https://github.com/mlfoundations/mint-1t

MINT-1T: мультимодальный чередующийся набор данных объемом один триллион токенов.

Мультимодальные чередующиеся наборы данных, включающие чередующиеся последовательности изображений и текста свободной формы, имеют решающее значение для обучения передовых больших мультимодальных моделей (LMM). Несмотря на быстрое развитие LMM с открытым исходным кодом, по-прежнему наблюдается выраженный дефицит крупномасштабных разнообразных мультимодальных чередующихся наборов данных с открытым исходным кодом. В ответ на это мы представляем MINT-1T, самый обширный и разнообразный набор данных Multimodal INTerleaved с открытым исходным кодом на сегодняшний день.

https://github.com/mlfoundations/mint-1t


>>Click here to continue<<

Big data world






Share with your best friend
VIEW MORE

United States America Popular Telegram Group (US)