Create: Update:
شرکت OpenAI امشب در آخرین روز از «۱۲ روز با OpenAI» از مدل o3 رونمایی کردن. این مدل به حدی قوی بوده که در بنچمارکهای ARC-AGI که یک بنچمارک برای وظایفی که از یک AGI انتظار میره هست، تونسته به 87.5% در حالت high-computingش البته با مصرف میلیونها توکن برسه. درحالی که مدل o1 فقط به 13درصد رسیده بود. از طرفی هنوز در بعضی از تسکهای این بنچمارک ضعفهایی رو نشون داده که نشوندهنده راه دراز برای رسیدن به یک AGI کامل هست اما بسیار پیشرفت چشمگیریه. این مدل به ریتینگ 2727 کدفرسز رسیده که این یعنی رتبه 175م این سایت، درواقع این مدل الان به راحتی میتونه به یک مدال جهانی المپیاد کامپیوتر(IOI) برسه. نسخه mini این مدل در اواخر ماه بعد عرضه خواهد شد. البته شرکتها و پژوهشگران میتونن برای تستهای safety به این مدل دسترسی داشته باشن.
tweet
hadi @geekalerts
tweet
hadi @geekalerts
شرکت OpenAI امشب در آخرین روز از «۱۲ روز با OpenAI» از مدل o3 رونمایی کردن. این مدل به حدی قوی بوده که در بنچمارکهای ARC-AGI که یک بنچمارک برای وظایفی که از یک AGI انتظار میره هست، تونسته به 87.5% در حالت high-computingش البته با مصرف میلیونها توکن برسه. درحالی که مدل o1 فقط به 13درصد رسیده بود. از طرفی هنوز در بعضی از تسکهای این بنچمارک ضعفهایی رو نشون داده که نشوندهنده راه دراز برای رسیدن به یک AGI کامل هست اما بسیار پیشرفت چشمگیریه. این مدل به ریتینگ 2727 کدفرسز رسیده که این یعنی رتبه 175م این سایت، درواقع این مدل الان به راحتی میتونه به یک مدال جهانی المپیاد کامپیوتر(IOI) برسه. نسخه mini این مدل در اواخر ماه بعد عرضه خواهد شد. البته شرکتها و پژوهشگران میتونن برای تستهای safety به این مدل دسترسی داشته باشن.
tweet
hadi @geekalerts
tweet
hadi @geekalerts
>>Click here to continue<<
Geek Alerts

