🔥 Очередной релиз от Alibaba — новая мультимодальная модель Ovis‑U1‑3B.
🧠 Поддерживает:
• Понимание изображений (Image-to-Text )
• Генерация картинок по описанию (Text-to-Image)
• Интерактивное редактирование изображений (Inpainting по тексту)
⚙️ Размер: всего 3B параметров
📊 Производительность:
• 69.6 баллов в OpenCompass (выше, чем у Qwen 2.5 и Ovis-2)
• GenEval Accuracy: 0.89 — превосходит GPT-4o
• ImgEdit-Bench: почти на уровне GPT-4o (4.0 vs 4.2)
💡 Под капотом:
• Архитектура Ovis (Open Vision System)
• Поддержка генерации 1024×1024 с CFG
Хорошая маленькая, но мощная моделька, выйдает достойные генерации на демке.
@ai_machinelearning_big_data
#Alibaba #opensource
>>Click here to continue<<






