БФТ-Холдинг

Data Scientist в R&D направление (LLM)

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 1 года до 3 лет
  • Python
  • SQL
  • Apache Airflow

Приглашаем в команду Data Scientist / ML-инженера для работы над созданием и развитием ИИ-помощника для автоматизации технической поддержки (NLP, RAG). Ожидается пилотирование моделей, оценка качества генерации. Важно ориентироваться на метрики, которые отражают реальную полезность и точность ответов.

Цель - создать масштабируемую, адаптивную и интерпретируемую систему поддержки, способную эффективно взаимодействовать с пользователями, понимать их запросы и предоставлять релевантные, точные и проверяемые ответы на основе корпоративных знаний и внешних источников.

Собственная микросервисная платформа для построения высоконагруженных распределенных проектов, NoSQL хранилище, построение моделей для аналитики, AI, OLAP, BI.

На нашей платформе работает портал «Работа в России» - второй по величине государственный федеральный портал.

Направления развития платформы охватывают все современные IT тенденции, начиная от машинного анализа многомерных данных и заканчивая построением автоматизированной UX системы сбора информации для проектирования интерфейсов.

Стек: Python, Airflow, keras, catboost, ollama

Работа на проекте дает возможность:

  • Проанализировать поведение модели в реальных пользовательских сценариях;
  • Влиять на архитектуру пайплайна, включая retrieval, reranking, prompt engineering и fine-tuning;
  • Вывести RAG-пайплайн в продакшен;
  • Работать над исследовательскими задачами с влиянием на тысячи пользователей.

Обязанности:

  • Разработка и поддержка пайплайнов обработки данных для LLM с использованием RAG

  • Подготовка и разметка датасетов для обучения и тестирования моделей

  • Поиск точек автоматизации в направлении работы технической поддержки информационных систем

Требования:

  • Уверенное владение SQL (приоритет PostgreSQL, на уровне оптимизации производительности сложных запросов)
  • Владение Python (pandas, numpy, matplotlib, seaborn и др.)
  • Опыт построения RAG - пайплайна

Будет плюсом:

  • опыт работы с apache airflow / MLFlow
  • опыт работы с векторными БД (Qdrant) / графовыми БД
  • опыт файнтюнинга и квантирования современных моделей ИИ:
    LLM (LLama / Mistral / Vikhr / T-Pro ), кросс-энкодеры, реранкеры
  • опыт аналитики, исследований, поиска факторов и корреляций в данных

Условия:

  • ДМС после испытательного срока с возможностью страхования детей и родственников;
  • Спорт и изучение английского языка со скидкой;
  • Корпоративная валюта, с помощью которой можно приобрести ценные подарки, компенсировать расходы на детский лагерь или занятия спортом;
  • Праздники и ивенты — неотъемлемая часть нашей корпоративной культуры;
  • Удобные процессы: оформляем кадровые документы в электронном виде онлайн и без бумаги. И, конечно же, у нас всё прозрачно и надежно: белое оформление по ТК РФ;
  • Удаленный формат работы