TG Telegram Group & Channel
Data Science Work | United States America (US)
Create: Update:

#удаленка #вакансия #Datascientist #middle
☁️Позиция: middle Data Scientist
🏙Компания: IT Pearls (проект X5 Retail Group)
💰зп: вилка: 180к — 250к
📅формат работы: Удаленка (РФ)
📅занятость: Full-time
Контакт: @Natali_HRit (Наталья)

📌Задачи:
- Разработка алгоритма ранжирования PLU на основе финансовых показателей так, чтобы наш DS-модуль мог учитывать в прогнозе продаж ранее неиспользованные финансовые показатели.
- Доработка текущего алгоритма выдачи прогноза по товарам-новинкам, которые продаются менее 3х месяцев в магазинах сети - не учитываются при выдаче прогноза дальнейших продаж.

📌Обязанности
- Разработка кода и тестов на Python, участие в командной разработке, участие в код-ревью 
- Проработка и изменение дизайна существующих компонент при необходимости 
- Подготовка и валидация обучающих выборок данных для внедрения и сопровождения математических моделей продуктов больших данных 
- Расчет результатов АБ-тестов, дизайн АБ-тестов 
- Внедрение современных методов машинного обучения и анализа данных в продуктах больших данных 
- Разворачивание моделей и сервисов в контуре х5 (Hadoop/K8S/AirFlow
- Написание запросов на sql, оптимизация запросов (Spark, в частности) 
- Предлагает идеи для улучшения модели/подхода 
- Предлагает прокси-метрики и функции потерь, связанные с бизнес-метриками 
- Контроль соответствия результатов работы менеджеров по работе с большими данными в релизах продуктов больших данных. 
- Техническая реализация data-science решений на продуктах департамента. 
- Формирование требований к данным для разработки математических моделей в рамках релизов продуктов больших данных. 
- Анализ предметной области с целью повышения качества моделей и формирования предложений по достижению целей проектов и продуктов больших данных.

📌Требования:
- Алгоритмы и структуры данных.
- Умеет оценивать сложность алгоритмов 
- Знает алгоритмы и структуры данных из стандартного курса
- Знает оценку сложности структур из для стандартной библиотеки 
- Знакомство с алгоритмами из расширенного набора: вероятностные, алгоритмы во внешней памяти, алгоритмы на графах ТВиМС 
- Предельные теоремы и умение их применять проверка гипотез бутстреп A/B-тесты variance reduction causal inference ML 
- Понимает ML-алгоритмы и методы в области. 
- Эффективно адаптирует их для решения задач при необходимости. 
- Строит модели из стандартных компонент. 
- Понимает шаги жизненного цикла ML-разработки и их взаимодействие в проекте, при необходимости изменяет существующий дизайн. 
- Понимает, какие бизнес-метрики для модели нужно мониторить 
- Может предложить прокси-метрики и функцию потерь, связанные с бизнес-метриками 
- Может докатить простую модель в пилот имплементировать метод по статье встроить компонент в существующий пайплайн 
- Знаком с менее распространенными методами МО (например: байесовские модели/PGM/VBI, RL и прочее). MLOps 
- Разово может зафиттить модель, по запросу проверить, жива ли она, обновить развернуть какое-либо необходимое ПО в кластере версионирование моделей, данных мониторинг работы моделей, качества данных sql Простые запросы (select'ы/группировки и т.д.) Окна 
- Оптимизация запросов 
- Engineering 
- Переводит идеи в чистый код, который будут и исполнять, и читать 
- Пользуется Git'ом 
- Пишет тесты 
- Способен разбираться в чужом коде и эффективно его дебажить 
- Базовое понимание всех компонентов архитектуры 
- Использование лучших практик разработки DB&BD 
- Промышленный опыт работы с несколькими системами 
- Знание внутреннего устройства систем, используемых в работе оптимизация вычислений/запросов транзакции/ACID/Индексы Other 
- Может декомпозировать понятные задачи 
- Самостоятельно находит решение или использует существующие подходы для понятных задач

🔥Если все нравится - пиши @Natali_HRit

#удаленка #вакансия #Datascientist #middle
☁️Позиция: middle Data Scientist
🏙Компания: IT Pearls (проект X5 Retail Group)
💰зп: вилка: 180к — 250к
📅формат работы: Удаленка (РФ)
📅занятость: Full-time
Контакт: @Natali_HRit (Наталья)

📌Задачи:
- Разработка алгоритма ранжирования PLU на основе финансовых показателей так, чтобы наш DS-модуль мог учитывать в прогнозе продаж ранее неиспользованные финансовые показатели.
- Доработка текущего алгоритма выдачи прогноза по товарам-новинкам, которые продаются менее 3х месяцев в магазинах сети - не учитываются при выдаче прогноза дальнейших продаж.

📌Обязанности
- Разработка кода и тестов на Python, участие в командной разработке, участие в код-ревью 
- Проработка и изменение дизайна существующих компонент при необходимости 
- Подготовка и валидация обучающих выборок данных для внедрения и сопровождения математических моделей продуктов больших данных 
- Расчет результатов АБ-тестов, дизайн АБ-тестов 
- Внедрение современных методов машинного обучения и анализа данных в продуктах больших данных 
- Разворачивание моделей и сервисов в контуре х5 (Hadoop/K8S/AirFlow
- Написание запросов на sql, оптимизация запросов (Spark, в частности) 
- Предлагает идеи для улучшения модели/подхода 
- Предлагает прокси-метрики и функции потерь, связанные с бизнес-метриками 
- Контроль соответствия результатов работы менеджеров по работе с большими данными в релизах продуктов больших данных. 
- Техническая реализация data-science решений на продуктах департамента. 
- Формирование требований к данным для разработки математических моделей в рамках релизов продуктов больших данных. 
- Анализ предметной области с целью повышения качества моделей и формирования предложений по достижению целей проектов и продуктов больших данных.

📌Требования:
- Алгоритмы и структуры данных.
- Умеет оценивать сложность алгоритмов 
- Знает алгоритмы и структуры данных из стандартного курса
- Знает оценку сложности структур из для стандартной библиотеки 
- Знакомство с алгоритмами из расширенного набора: вероятностные, алгоритмы во внешней памяти, алгоритмы на графах ТВиМС 
- Предельные теоремы и умение их применять проверка гипотез бутстреп A/B-тесты variance reduction causal inference ML 
- Понимает ML-алгоритмы и методы в области. 
- Эффективно адаптирует их для решения задач при необходимости. 
- Строит модели из стандартных компонент. 
- Понимает шаги жизненного цикла ML-разработки и их взаимодействие в проекте, при необходимости изменяет существующий дизайн. 
- Понимает, какие бизнес-метрики для модели нужно мониторить 
- Может предложить прокси-метрики и функцию потерь, связанные с бизнес-метриками 
- Может докатить простую модель в пилот имплементировать метод по статье встроить компонент в существующий пайплайн 
- Знаком с менее распространенными методами МО (например: байесовские модели/PGM/VBI, RL и прочее). MLOps 
- Разово может зафиттить модель, по запросу проверить, жива ли она, обновить развернуть какое-либо необходимое ПО в кластере версионирование моделей, данных мониторинг работы моделей, качества данных sql Простые запросы (select'ы/группировки и т.д.) Окна 
- Оптимизация запросов 
- Engineering 
- Переводит идеи в чистый код, который будут и исполнять, и читать 
- Пользуется Git'ом 
- Пишет тесты 
- Способен разбираться в чужом коде и эффективно его дебажить 
- Базовое понимание всех компонентов архитектуры 
- Использование лучших практик разработки DB&BD 
- Промышленный опыт работы с несколькими системами 
- Знание внутреннего устройства систем, используемых в работе оптимизация вычислений/запросов транзакции/ACID/Индексы Other 
- Может декомпозировать понятные задачи 
- Самостоятельно находит решение или использует существующие подходы для понятных задач

🔥Если все нравится - пиши @Natali_HRit


>>Click here to continue<<

Data Science Work




Share with your best friend
VIEW MORE

United States America Popular Telegram Group (US)