Ну что же, 300 🔥 есть, начинаем обсуждать вопросы с собесов.
Вот два вопроса на насущную тему «а сколько данных нужно». Делимся своими мыслями, потом подведу итоги :)
1. При обучении модели качество получилось недостаточно высоким. Была выдвинута гипотеза, что проблема в недостаточном объеме обучающей выборки. Как можно проверить эту гипотезу?
2. Часто данные не размечены, и вам бизнес-заказчик задает вопрос, какой объем выборки разметить. Как до знакомства с данными ответить на этот вопрос? Какие статистики могут помочь? Какие эффекты возможны при недостатке данных?
>>Click here to continue<<