КОГО МЫ ИЩЕМ?
MIDDLE ML/NLP Engineer в команду Прогрессоры
ОПИСАНИЕ ПРОДУКТА
Мы развиваем AI функционал в продукте, который дает возможность пользователям открывать новый для себя контент и места для интересного времяпрепровождения с учетом их личных предпочтений. Поиск по промпту, предиктивные рекомендации с учетом данных профиля пользователя и социального графа - это и еще многие другие задачи, которыми мы занимаемся.
Наша команда подошли к этапу продуктивизации существующих прототипов, и мы ищем ML/NLP инженера, который поможет улучшить их механики и будет работать вместе с нами над самыми смелыми идеями, проводя исследования и эксперименты по их реализации.
ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ
-
Улучшать существующие сервисы поиска и рекомендаций контента и разрабатывать новые
Производить количественные и качественные оценки работы pipeline'ов и принимать на основе метрик решения о дальнейших изменения -
Экспериментировать с LLM и подбирать оптимальные методы обучения/дообучения для задач query understanding, NER, классификации
-
Разрабатывать облегченные модели, заточенные под конкретный домен контента и задачи
-
Участвовать в разработке ML архитектуры и взаимодействовать с DE для определения оптимальной структуры данных
-
Много исследовать и экспериментировать в рамках реализации персонализации и предиктивных рекомендаций
ЧТО НУЖНО ДЛЯ ЭТОЙ РАБОТЫ
-
Опыт от 2 лет
-
Опыт разработки на Python с использование основных data библиотек (pandas, polars, NumPy)
-
Базовое знание SQL на уровне извлечения данных из каталогов для анализа и экспериментов
-
Уверенная база по классическому ML
-
Опыт работы с LLM (Prompt Engineering & Tuning)
-
Понимание, как выполнять Fine Tuning, в частности используя PEFT методы (LoRA)
-
Опыт использования ML/DL фреймворков для обучения (PyTorch)
-
Понимания архитектуры трансформеров, в частности BERT и GPT семейств
-
Понимание, как выполнять Fine Tuning, в частности используя PEFT методы (LoRA)
-
Опыт использования ML/DL фреймворков для обучения (PyTorch)
-
Умение пользоваться docker и инструментами для serving'а моделей (vLLM, Triton, KServe, Ray Serve)
-
Понимание основных метрик, в особенности для классификации и IR (information retrieval), и умение их интерпретировать
ЧТО МЫ ИСПОЛЬЗУЕМ:
-
Сервисы на Python (FastAPI)
-
Weaviate для гибридного поиска
-
PostgreSQL, MongoDB, RedisSearch
-
Airflow, Flink - k8s, VM с GPU A100 80Gb
-
serving через vLLM, в планах переход на KubeFLow с KubeRay
-
MTS Big Data
ЧТО ПРЕДЛАГАЕМ
- Cобственную платформу MTS Ocean для получения ИТ-ресурсов, а это значит, что деплой, мониторинг, observability — не будут для тебя проблемой, ты сможешь сосредоточиться на фичах;
- Профессиональные гильдии инженеров, где мы поддерживаем друг друга и помогаем стать лучше;
- Внутреннюю площадку TechTalks для обмена опытом, дискуссий, развития навыков самопрезентации;
- Участие во внешних IT конференциях. Мы выступаем на HighLoad++, DataFest, Mobius, Test Driven Conf, Joker, DevOps, Матемаркетинг и даже проводим собственную конференцию по архитектуре True Tech Arch;
- Полезные курсы и вебинары в корпоративном университете и электронную библиотеку.
А еще:
- ДМС с первого месяца работы, включая стоматологию;
- Страхование от несчастных случаев с 1 месяца работы.
- Материальную помощь в сложных жизненных ситуациях;
- Отпуск 28 календарных дней;
- Прием врачей общей практики и массаж в офисе;
- Мобильная связь за счет компании и льготные тарифы для близких;
- Подписка на онлайн-кинотеатр KION, сервис МТС Музыка, книжный сервис Строки от МТС, безлимитные мессенджеры и соцсети.