Видео (2 часа 26 минут) моего вебинара "Образование для образованных в 2025" на разных платформах (и слайды тоже). Мысли Karpathy про примат RL по сравнению с RLHF и о том, как писать учебники для LLM (хинт: как и для людей — учебный материал, примеры задач с решениями, затем много задач с ответом — и вот эти "задачи с ответом" как раз фронтир, это RL). Провёл некоторое количество игр "барышня-мадам", пишу про необходимость примерно 4 часов тренировки — пока не научатся надёжно удерживать "вещь в окружении в момент эксплуатации" в ходе рассуждений, я тут даже слова "система" не говорю. В чате моего канала очередной приступ психологии — много туда писал, а вирус психологического трёпа надо удавливать, на темы психологии надо беседовать не с людьми, а с o1, R1, Gemini Thinking, если уж совсем невтерпёж (при этом понятно, что уж совсем невтерпёж!). У Fields и Levin вышла очередная работа, и по этому поводу я много часов беседовал с нежитью — изучал вопрос, может ли нежить предложить, как использовать знания из статьи для инженерии и менеджмента, привожу пять соображений на эту тему.
Картинка из поста Karpathy.
https://ailev.livejournal.com/1751581.html (17Кзнаков)
>>Click here to continue<<
