Новая модель GPT-4 Omni просто нереальна в задач с написанием кода.
Модель уже постепенно (не сразу всем) раскатывают на юзеров, по моим ощущениям, бесплатные юзеры могут задавать до 10 сообщений раз в 3 часа, а платные — до 80 сообщений.
Касательно бенчмарков: пока ничего внятного не видел, но в кодинге Omni опережает конкурентов на 100 ELO — это такая система оценивания, которую LLM-арена (место, где юзеры оценивают модели) стащила у шахмат. И это очень, очень много.
Все ещё страшно думать, что покажут с GPT-5.
>>Click here to continue<<