-
Полный цикл машинного обучения и исследования моделей;
-
Проектирование NLP-решений для классификации, мэтчинга и прогнозирования;
-
Тестирование, оптимизация и разработка моделей (LLM, RAG, RecSys);
-
Разработка эмбеддингов, векторных представлений текстовых данных и развертывание моделей в production среде;
-
Построение и оптимизация пайплайнов, а также разработка высоконагруженных ML-сервисов;
-
Подготовка данных: анализ источников, очистка, преобразование;
-
Проведение технического и функционального тестирования моделей;
-
Ведение документации и создание отчетности о результатах работы;
-
Участие в кросс-командных проектах обработки данных;
-
Участие в создании или адаптации LLM-платформ.
- Опыт от 1 года в Data Science;
- Знание Python и основные библиотеки: numpy, pandas, sklearn, pytorch, transformers и другие;
- Знание алгоритмов, структур данных и понимание современных подходов в ML/DL (включая разработку, внедрение и сопровождение);
- Знания машинного обучения и статистики;
- Умение работать с текстовыми данными, NLP (например, определение категорий по описаниям товаров), LLM (LLaMA-2 и др.);
- Понимание принципов и технологии обучения больших языковых моделей (GPT и другие генеративные трансформеры).
Будет плюсом:
-
Знание архитектуры и умение масштабировать решения на уровне ПО и железа;
-
Опыт вывода моделей в production и их оптимизация как на CPU, так и на GPU уровне;
-
Умение производить челлендж подходов, предлагать альтернативы и опираться на исследования.
- Возможность полностью удаленной работы;
- Отсутствие бюрократии и бессмысленных процессов;
- Работа в IT-компании, аккредитованной в Министерстве цифрового развития;
- Возможности для роста и развития;
- Достойная, полностью «белая» оплата труда.