DA ENTERPRISES LLC

AI/ML Engineer (Mid-level, On-Prem)

Не указана
  • Польша
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет

Наша компания создаёт локальные (on-prem) AI-системы для автоматизации ключевых бизнес-процессов компаний — от обработки входящих запросов до отчётов и поддержки принятия решений.

Цель проектов — построить «умный слой» поверх корпоративных систем, чтобы компании работали быстрее, точнее и эффективнее. Это не пилотные эксперименты, а стратегические продукты, которые становятся ядром бизнеса наших клиентов.

Роль

Ищем Mid-level AI/ML Engineer, который закрывает фичи end-to-end: от ETL и модели (LLM/ML) до сервиса и простого дашборда; берёт на себя разработку модулей и пайплайнов; работает с LLM-фреймворками и интеграциями.

Задачи

  • Разрабатывать, развёртывать и эксплуатировать локальные LLM-модули (RAG, инструменты, интеграции с внутренними сервисами), обеспечивая их онлайн-инференс через vLLM/TGI.
  • Готовить данные и строить ML-модели (CatBoost/XGBoost/LightGBM, тайм-серии) под доменные задачи.
  • Делать интеграции с Postgres/ClickHouse, ERP/CRM, REST/gRPC, очередями.
  • Реализовывать RAG on-prem (Postgres+pgvector/Milvus), приватные эмбеддинги, контроль доступа на уровне документов.
  • Настраивать MLOps: MLflow (эксперименты/реестр), DVC, пайплайны (Airflow/Argo), мониторинг/логирование (Prometheus/Grafana, OpenSearch/ELK).
  • Упаковывать в сервисы (FastAPI), писать pytest, интеграционные тесты, golden-sets, базовые UI/дашборды (Dash/Plotly).
  • Соблюдать безопасность: RBAC/SSO (Keycloak), Vault, аудит, санитайзинг; запрет внешних вызовов с прод-данными.

Must have

  • Python 2+ года опыта.
  • Уверенный SQL (Postgres/ClickHouse), ETL (pandas/polars), партиционирование, индексы.
  • Построение сервисов (FastAPI, Celery, Flask).
  • LLM on-prem: опыт с vLLM или TGI, RAG, эмбеддинги, базовая дообучаемость (LoRA/SFT) офлайн.
  • ML: практика с CatBoost/XGBoost/LightGBM, метрики (AUC/PR, RMSE/MAE, logloss), валидация, фичеинжиниринг.
  • Разработка и адаптация моделей на базе Transformers.
  • Проведение fine-tuning и оптимизации моделей (квантизация, дистилляция, ускорение inference).
  • Фундаментальные знания мат. статистики: A/B тесты, проверка гипотез, вероятностные модели, интерпретация бизнес-метрик (воронки, удержание, конверсии), корреляционный и регрессионный анализ.

Nice to have

  • Инструменты оркестрации рабочих процессов: Airflow/Argo.
  • Системы обмена сообщениями ( Kafka/RabbitMQ ).
  • Метрики игр (Retention, LTV, ROAS), выживаемость/классические тайм-серии.
  • LangGraph, LangChain (осознанное применение).
  • Опыт аналитики бизнес-данных.
  • Опыт работы в e-commerce.

Условия

  • Участие в стратегически важном AI-продукте компании.
  • Возможность влиять на архитектуру и будущее развитие системы.
  • Гибкий график и удалённый формат работы.
  • Среда, где приветствуются эксперименты, R&D и внедрение новых подходов.
  • On-prem окружение, приватные артефакты, локальный Docker-реестр.
  • Текущий стек: Python, FastAPI/Flask, vLLM/TGI, Postgres(+pgvector)/ClickHouse, MLflow/DVC, Airflow/Argo, Prometheus/Grafana, Dash/Plotly.
  • Пространство для профессионального роста.