Приглашаем в команду Data Scientist / ML-инженера для работы над созданием и развитием ИИ-помощника для автоматизации технической поддержки (NLP, RAG). Ожидается пилотирование моделей, оценка качества генерации. Важно ориентироваться на метрики, которые отражают реальную полезность и точность ответов.
Цель - создать масштабируемую, адаптивную и интерпретируемую систему поддержки, способную эффективно взаимодействовать с пользователями, понимать их запросы и предоставлять релевантные, точные и проверяемые ответы на основе корпоративных знаний и внешних источников.
Собственная микросервисная платформа для построения высоконагруженных распределенных проектов, NoSQL хранилище, построение моделей для аналитики, AI, OLAP, BI.
На нашей платформе работает портал «Работа в России» - второй по величине государственный федеральный портал.
Направления развития платформы охватывают все современные IT тенденции, начиная от машинного анализа многомерных данных и заканчивая построением автоматизированной UX системы сбора информации для проектирования интерфейсов.
Стек: Python, Airflow, keras, catboost, ollama
Работа на проекте дает возможность:
- Проанализировать поведение модели в реальных пользовательских сценариях;
- Влиять на архитектуру пайплайна, включая retrieval, reranking, prompt engineering и fine-tuning;
- Вывести RAG-пайплайн в продакшен;
- Работать над исследовательскими задачами с влиянием на тысячи пользователей.
Обязанности:
-
Разработка и поддержка пайплайнов обработки данных для LLM с использованием RAG
-
Подготовка и разметка датасетов для обучения и тестирования моделей
-
Поиск точек автоматизации в направлении работы технической поддержки информационных систем
Требования:
- Уверенное владение SQL (приоритет PostgreSQL, на уровне оптимизации производительности сложных запросов)
- Владение Python (pandas, numpy, matplotlib, seaborn и др.)
- Опыт построения RAG - пайплайна
Будет плюсом:
- опыт работы с apache airflow / MLFlow
- опыт работы с векторными БД (Qdrant) / графовыми БД
- опыт файнтюнинга и квантирования современных моделей ИИ:
LLM (LLama / Mistral / Vikhr / T-Pro ), кросс-энкодеры, реранкеры - опыт аналитики, исследований, поиска факторов и корреляций в данных
Условия:
- ДМС после испытательного срока с возможностью страхования детей и родственников;
- Спорт и изучение английского языка со скидкой;
- Корпоративная валюта, с помощью которой можно приобрести ценные подарки, компенсировать расходы на детский лагерь или занятия спортом;
- Праздники и ивенты — неотъемлемая часть нашей корпоративной культуры;
- Удобные процессы: оформляем кадровые документы в электронном виде онлайн и без бумаги. И, конечно же, у нас всё прозрачно и надежно: белое оформление по ТК РФ;
- Удаленный формат работы