[Папир][Датасет на лицехватс][Пост на CV Time]
Коллеги из Yandex Research выкатили публичный датасет, под названием Alchemist 🧪, из 3 c небольшим тысяч картинок, собранных из интернета, для дообучения диффузионок.
Данный датасет, отобранный с помощью довольно занятного пайплайна, дает заметный прирост качества на разных моделях (в отличие от LAION-Aesthetics и просто фоток анимешных тяночек).
Так что, ежели кому нужно заалайнить модельку на качественных данных, далеко ходить теперь не надо.
>>Click here to continue<<
