Обязанности:
- анализ бизнес-требований и формализация задач в математические модели для последующего решения с помощью методов машинного обучения;
- улучшение моделей, адаптация к изменениям данных и бизнес-требований, а также документирование решений и процессов;
- сбор, очистка и подготовка данных из различных источников в формате, пригодном для построения и обучения моделей, настраивать потоки данных.
- разработка, обучение и валидация моделей машинного обучения;
- проведение тестирования моделей на реальных данных.
-
опыт работы от 2 до 4 лет в роли Data Scientist;
-
опыт с Python на высоком уровне (понимание механизмов работы с памятью, многопоточность);
-
техники параллелизации обработки датафреймов pyTorch/TensorFlow;
-
навыки оптимизации для продакшна: ONNX, TensorRT, квантование;
-
умение работать с большими датасетами и распределенными вычислениями (GPU/TPU);
-
NLP: эмбеддинги, анализ текстовых данных.