TG Telegram Group & Channel
باشگاه فناوران اطلاعات مکانی | United States America (US)
Create: Update:

شرکت OpenAI امشب در آخرین روز از «۱۲ روز با OpenAI» از مدل o3 رونمایی کردن. این مدل به حدی قوی بوده که در بنچمارک‌های ARC-AGI که یک بنچمارک برای وظایفی‌ که از یک AGI انتظار می‌ره هست، تونسته به 87.5% در حالت high-computingش البته با مصرف میلیون‌ها توکن برسه. درحالی که مدل o1 فقط به 13درصد رسیده بود. از طرفی هنوز در بعضی از تسک‌های این بنچمارک ضعف‌هایی رو نشون داده که نشون‌دهنده راه دراز برای رسیدن به یک AGI کامل هست اما بسیار پیشرفت چشمگیریه. این مدل به ریتینگ 2727 کدفرسز رسیده که این یعنی رتبه 175م این سایت، به طوری که از 99.9% انسان‌های فعلی بهتر می‌تونه سوالات این سایت رو حل کنه. نسخه mini این مدل در اواخر ماه بعد عرضه خواهد شد. البته شرکت‌ها و پژوهشگران می‌تونن برای تست‌های safety به این مدل دسترسی داشته باشن.

tweet
hadi @geekalerts

Forwarded from Geek Alerts
شرکت OpenAI امشب در آخرین روز از «۱۲ روز با OpenAI» از مدل o3 رونمایی کردن. این مدل به حدی قوی بوده که در بنچمارک‌های ARC-AGI که یک بنچمارک برای وظایفی‌ که از یک AGI انتظار می‌ره هست، تونسته به 87.5% در حالت high-computingش البته با مصرف میلیون‌ها توکن برسه. درحالی که مدل o1 فقط به 13درصد رسیده بود. از طرفی هنوز در بعضی از تسک‌های این بنچمارک ضعف‌هایی رو نشون داده که نشون‌دهنده راه دراز برای رسیدن به یک AGI کامل هست اما بسیار پیشرفت چشمگیریه. این مدل به ریتینگ 2727 کدفرسز رسیده که این یعنی رتبه 175م این سایت، به طوری که از 99.9% انسان‌های فعلی بهتر می‌تونه سوالات این سایت رو حل کنه. نسخه mini این مدل در اواخر ماه بعد عرضه خواهد شد. البته شرکت‌ها و پژوهشگران می‌تونن برای تست‌های safety به این مدل دسترسی داشته باشن.

tweet
hadi @geekalerts


>>Click here to continue<<

باشگاه فناوران اطلاعات مکانی







Share with your best friend
VIEW MORE

United States America Popular Telegram Group (US)