TG Telegram Group & Channel
کتابخانه مهندسی کامپیوتر و پایتون | United States America (US)
Create: Update:

خبر داغ از کمپانی Alibaba
مدل‌های زبانی جدیدشون یعنی Qwen3 رو معرفی کردند!

- مدل پرچم‌دار: Qwen3-235B-A22B: عملکرد عالی توی برنامه‌نویسی، ریاضی و قابلیت‌های عمومی — در حد و اندازه DeepSeek-R1، o1، Grok-3، Gemini-2.5-Pro و مدل‌های دیگه‌ی سطح بالا.

- مدل‌های MoE: مدل Qwen3-30B-A3B حتی از QwQ-32B بهتره، با اینکه ۱۰ برابر پارامتر فعال کمتری داره!

مدل کوچیک‌تر Qwen3-4B هم پا‌به‌پای Qwen2.5-72B-Instruct میاد جلو!
- مدل‌هایی که اپن‌سورس شدن:
- ۲ مدل MoE: یکی با ۲۳۵ میلیارد پارامتر، یکی با ۳۰ میلیارد
- ۶ مدل dense از ۳۲B تا ۰.۶B پارامتر
- همگی تحت لایسنس Apache 2.0 منتشر شدن!
بلاگشون را بخوانید که کلی مطلب توش هست به همراه لینک به تمام مدلها!!!
‌Blog: https://qwenlm.github.io/blog/qwen3/


#هوش‌_مصنوعی
🆔 @programmers_street

This media is not supported in your browser
VIEW IN TELEGRAM
خبر داغ از کمپانی Alibaba
مدل‌های زبانی جدیدشون یعنی Qwen3 رو معرفی کردند!

- مدل پرچم‌دار: Qwen3-235B-A22B: عملکرد عالی توی برنامه‌نویسی، ریاضی و قابلیت‌های عمومی — در حد و اندازه DeepSeek-R1، o1، Grok-3، Gemini-2.5-Pro و مدل‌های دیگه‌ی سطح بالا.

- مدل‌های MoE: مدل Qwen3-30B-A3B حتی از QwQ-32B بهتره، با اینکه ۱۰ برابر پارامتر فعال کمتری داره!

مدل کوچیک‌تر Qwen3-4B هم پا‌به‌پای Qwen2.5-72B-Instruct میاد جلو!
- مدل‌هایی که اپن‌سورس شدن:
- ۲ مدل MoE: یکی با ۲۳۵ میلیارد پارامتر، یکی با ۳۰ میلیارد
- ۶ مدل dense از ۳۲B تا ۰.۶B پارامتر
- همگی تحت لایسنس Apache 2.0 منتشر شدن!
بلاگشون را بخوانید که کلی مطلب توش هست به همراه لینک به تمام مدلها!!!
‌Blog: https://qwenlm.github.io/blog/qwen3/


#هوش‌_مصنوعی
🆔 @programmers_street


>>Click here to continue<<

کتابخانه مهندسی کامپیوتر و پایتون




Share with your best friend
VIEW MORE

United States America Popular Telegram Group (US)