Наша компания создаёт локальные (on-prem) AI-системы для автоматизации ключевых бизнес-процессов компаний — от обработки входящих запросов до отчётов и поддержки принятия решений.
Цель проектов — построить «умный слой» поверх корпоративных систем, чтобы компании работали быстрее, точнее и эффективнее. Это не пилотные эксперименты, а стратегические продукты, которые становятся ядром бизнеса наших клиентов.
Роль
Ищем Mid-level AI/ML Engineer, который закрывает фичи end-to-end: от ETL и модели (LLM/ML) до сервиса и простого дашборда; берёт на себя разработку модулей и пайплайнов; работает с LLM-фреймворками и интеграциями.
Задачи
- Разрабатывать, развёртывать и эксплуатировать локальные LLM-модули (RAG, инструменты, интеграции с внутренними сервисами), обеспечивая их онлайн-инференс через vLLM/TGI.
- Готовить данные и строить ML-модели (CatBoost/XGBoost/LightGBM, тайм-серии) под доменные задачи.
- Делать интеграции с Postgres/ClickHouse, ERP/CRM, REST/gRPC, очередями.
- Реализовывать RAG on-prem (Postgres+pgvector/Milvus), приватные эмбеддинги, контроль доступа на уровне документов.
- Настраивать MLOps: MLflow (эксперименты/реестр), DVC, пайплайны (Airflow/Argo), мониторинг/логирование (Prometheus/Grafana, OpenSearch/ELK).
- Упаковывать в сервисы (FastAPI), писать pytest, интеграционные тесты, golden-sets, базовые UI/дашборды (Dash/Plotly).
- Соблюдать безопасность: RBAC/SSO (Keycloak), Vault, аудит, санитайзинг; запрет внешних вызовов с прод-данными.
Must have
- Python 2+ года опыта.
- Уверенный SQL (Postgres/ClickHouse), ETL (pandas/polars), партиционирование, индексы.
- Построение сервисов (FastAPI, Celery, Flask).
- LLM on-prem: опыт с vLLM или TGI, RAG, эмбеддинги, базовая дообучаемость (LoRA/SFT) офлайн.
- ML: практика с CatBoost/XGBoost/LightGBM, метрики (AUC/PR, RMSE/MAE, logloss), валидация, фичеинжиниринг.
- Разработка и адаптация моделей на базе Transformers.
- Проведение fine-tuning и оптимизации моделей (квантизация, дистилляция, ускорение inference).
- Фундаментальные знания мат. статистики: A/B тесты, проверка гипотез, вероятностные модели, интерпретация бизнес-метрик (воронки, удержание, конверсии), корреляционный и регрессионный анализ.
Nice to have
- Инструменты оркестрации рабочих процессов: Airflow/Argo.
- Системы обмена сообщениями ( Kafka/RabbitMQ ).
- Метрики игр (Retention, LTV, ROAS), выживаемость/классические тайм-серии.
- LangGraph, LangChain (осознанное применение).
- Опыт аналитики бизнес-данных.
- Опыт работы в e-commerce.
Условия
- Участие в стратегически важном AI-продукте компании.
- Возможность влиять на архитектуру и будущее развитие системы.
- Гибкий график и удалённый формат работы.
- Среда, где приветствуются эксперименты, R&D и внедрение новых подходов.
- On-prem окружение, приватные артефакты, локальный Docker-реестр.
- Текущий стек: Python, FastAPI/Flask, vLLM/TGI, Postgres(+pgvector)/ClickHouse, MLflow/DVC, Airflow/Argo, Prometheus/Grafana, Dash/Plotly.
- Пространство для профессионального роста.