Привет!
Мы команда Digital Biz Factory – эксперты в области финтеха. Наша основная задача – создание высокопроизводительных IT-команд на базе OpenSource-платформы Platform8. Мы развиваем и расширяем её, чтобы решать уникальные задачи каждого клиента. Работаем по модели Time&Material, что позволяет быстро и гибко адаптироваться под любые изменения.
Сейчас мы ищем в команду ML Engineer (LLM, RAG), который поможет нам развивать и совершенствовать систему Retrieval-Augmented Generation. Предстоит работа с самыми современными технологиями в области LLM, интеграцией моделей, CI/CD и мониторингом.
Что тебе предстоит делать:-
Разработка API-шлюза для поддержки динамической смены LLM-моделей.
-
Интеграция LiteLLM / vLLM для унифицированного доступа к облачным и локальным моделям.
-
Автоматизация процессов через GitLab CI/CD, обеспечение масштабируемости и отказоустойчивости.
-
Развертывание и настройка систем мониторинга (Langfuse, Grafana).
-
Выбор и настройка векторных баз данных.
-
Разработка универсальных парсеров документов на Python.
-
Реализация гибридного поиска (векторный + полнотекстовый) и реранкера.
-
Настройка RAG-системы для разных сценариев и задач.
-
Внедрение агентной системы на базе LLM с интеграцией в RAG.
-
Создание датасетов для валидации, мониторинга и обучения моделей.
-
Файнтюнинг LLM.
-
Опыт ML-разработки на Python (PyTorch, pandas, numpy, Jupyter, PyCharm).
-
Понимание архитектур LLM и нейросетей.
-
Практический опыт работы с RAG и LLM.
-
Знание API и работы с JSON.
-
Навыки работы в Linux и с командной строкой.
-
Опыт работы с Docker.
-
Оптимизация ML-систем по производительности.
-
Уверенное владение Git.
Будет плюсом: -
Опыт с PostgreSQL и написанием SQL-запросов.
-
Работа с legacy-инфраструктурой.
-
Знание Go.
-
Понимание основ backend и серверной архитектуры.
-
Индивидуальное обсуждение уровня оплаты труда, официальное трудоустройство по ТК РФ;
-
Гибкий график, удалённая работа;
-
Совместную работу с сильной командой профессионалов;
-
Возможность расти и развиваться вместе с нами.