Модель с открытым исходным кодом и 1,5B параметрами, обученная с помощью RL и превосходящая o1-preview по общему математическому мышлению.
▪Github: https://github.com/agentica-project/deepscaler
▪HF: https://huggingface.co/agentica-org/DeepScaleR-1.5B-Preview
▪Blog: https://pretty-radio-b75.notion.site/DeepScaleR-Surpassing-O1-Preview-with-a-1-5B-Model-by-Scaling-RL-19681902c1468005bed8ca303013a4e2
>>Click here to continue<<



