خبر داغ از کمپانی Alibaba
مدلهای زبانی جدیدشون یعنی Qwen3 رو معرفی کردند!
- مدل پرچمدار: Qwen3-235B-A22B: عملکرد عالی توی برنامهنویسی، ریاضی و قابلیتهای عمومی — در حد و اندازه DeepSeek-R1، o1، Grok-3، Gemini-2.5-Pro و مدلهای دیگهی سطح بالا.
- مدلهای MoE: مدل Qwen3-30B-A3B حتی از QwQ-32B بهتره، با اینکه ۱۰ برابر پارامتر فعال کمتری داره!
مدل کوچیکتر Qwen3-4B هم پابهپای Qwen2.5-72B-Instruct میاد جلو!
- مدلهایی که اپنسورس شدن:
- ۲ مدل MoE: یکی با ۲۳۵ میلیارد پارامتر، یکی با ۳۰ میلیارد
- ۶ مدل dense از ۳۲B تا ۰.۶B پارامتر
- همگی تحت لایسنس Apache 2.0 منتشر شدن!
بلاگشون را بخوانید که کلی مطلب توش هست به همراه لینک به تمام مدلها!!!
Blog: https://qwenlm.github.io/blog/qwen3/
#هوش_مصنوعی
🆔 @programmers_street
>>Click here to continue<<