TG Telegram Group & Channel
Geek Alerts | United States America (US)
Create: Update:

محققین اپل تو مقاله جدیدی با عنوان «توهم فکر کردن»، گفتن مدل‌های استدلالی‌ای که امروزه ازشون استفاده می‌کنیم، درسته که در بنچمارک‌های مخصوص عملکرد بهتری نسبت به مدل‌های غیراستدلالی دارن، اما در عملکرد واقعی فرق آنچنانی‌ای ندارن‌.
محقق‌ها برای رسیدن به همچین نتیجه‌ای چند پازل رو به مدل دادن و به مرور پیچیدگی پازل‌ها رو بیشتر کردن، در حالتی که پیچیدگی کم بوده مدل‌ غیراستدلالی عملکرد بهتری نشون داده اما در پیچیدگی متوسط مدل استدلالی بوده که دست بالاتر رو داشته. در نهایت در حالت آخر و پیچیدگی زیاد عملکرد هر دو مدل به صفر رسیده و هیچ کدوم نتونستن پازل رو حل کنن. نکته اینه که مدل‌های استدلالی تا یک حدی می‌تونن توکن‌های تفکری‌شون رو بسته به پیچیدگی افزایش بدن و بعد از رسیدن به اون حد توکن‌ها کاهش و درنتیجه عملکرد هم تضعیف می‌شه.

🔗 ml.apple
🤓 hadi @geekalerts

محققین اپل تو مقاله جدیدی با عنوان «توهم فکر کردن»، گفتن مدل‌های استدلالی‌ای که امروزه ازشون استفاده می‌کنیم، درسته که در بنچمارک‌های مخصوص عملکرد بهتری نسبت به مدل‌های غیراستدلالی دارن، اما در عملکرد واقعی فرق آنچنانی‌ای ندارن‌.
محقق‌ها برای رسیدن به همچین نتیجه‌ای چند پازل رو به مدل دادن و به مرور پیچیدگی پازل‌ها رو بیشتر کردن، در حالتی که پیچیدگی کم بوده مدل‌ غیراستدلالی عملکرد بهتری نشون داده اما در پیچیدگی متوسط مدل استدلالی بوده که دست بالاتر رو داشته. در نهایت در حالت آخر و پیچیدگی زیاد عملکرد هر دو مدل به صفر رسیده و هیچ کدوم نتونستن پازل رو حل کنن. نکته اینه که مدل‌های استدلالی تا یک حدی می‌تونن توکن‌های تفکری‌شون رو بسته به پیچیدگی افزایش بدن و بعد از رسیدن به اون حد توکن‌ها کاهش و درنتیجه عملکرد هم تضعیف می‌شه.

🔗 ml.apple
🤓 hadi @geekalerts
Please open Telegram to view this post
VIEW IN TELEGRAM


>>Click here to continue<<

Geek Alerts






Share with your best friend
VIEW MORE

United States America Popular Telegram Group (US)