На Google I/O connect не анонсировали, но сделали это сейчас -- полный релиз Gemma 3n, модель на основе матрёшечного трансформера (MatFormer), которая и так маленькая, но можно ещё и практически произвольные размеры из неё "выжимать" (между 2B и 4B). С крутыми аудио и картиночными энкодерами.
https://goo.gle/45EaFch
Результатами на LMArena нынче никого не удивишь, но блин для такого размера это круто.
>>Click here to continue<<
