«Баланс-Платформа»

Python developer (ML)

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет
  • Python
  • MLflow
  • Apache Airflow
  • pandas
  • Docker
  • SQL

Мы делаем сервис автоматизации распознавания документов. Используем как полностью автоматический вариант, так и вариант с Human-in-the-Loop. Мы ищем коллегу, сильного в Python и интересующегося ML и DS, кто вместе нами будет развивать сервис в части ускорения разработки, тестирования и поставки роботов, универсализации кодовой базы, снижения затрат на поддержку и развития мониторинга.

Результаты работы нашей команды видны на графиках PnL компании, куда мы вносим вклад как снижая себестоимость обработки документов, так и увеличивая продажи привлекая новых клиентов на наш продукт распознавания.

В команде минимум бюрократии и максимум пространства чтобы проявить себя.

Обязанности:

  • Мониторинг ML метрик и умение быстро разбираться в причинах их изменения.
  • Поддержка текущего функционала нескольких сервисов распознавания документов.
  • Разработка инференса моделей и постпроцессинга под бизнес требования.
  • Настройка ETL процессов + задачи по обработке данных в Airflow.
  • Обработка данных с помощью numpy, pandas.
Требования:
  • Опыт коммерческой разработки на python от 3 лет.
  • Понимание asyncio, threading, multiprocessing механизмов в Python.
  • Уверенно работаешь с Linux и git.
  • Опыт работы с Docker.
  • Опыт работы с DVC.
  • Опыт работы с реляционными СУБД: SQLAlchemy / Alembic / SQL / PostgreSQL.
  • Самостоятельность при анализе задач и в дальнейшей реализации, аналитический склад ума, умение и желание разбираться в сложных бизнес процессах.
  • Для тебя не проблема разобраться с новой библиотекой или чужим кодом.

Будет плюсом

  • Опыт разработки и поддержки ETL/ELT пайплайнов в Airflow.
  • Опыт инференса моделей в Nvidia Triton Inference Server.
  • Опыт работы с библиотеками opencv, pythorch, matplotlib.
  • Опыт работы clearMl.
  • Интересуешься mlops практиками

Наш стек

  • Python 3.8+
  • PostgreSQL / Redis / Clickhouse
  • RabbitMQ
  • Apache Airflow
  • Triton Inference Server
Условия:
  • Формат работы - гибрид/ удаленка из РФ.
  • Сложные и интересные задачи, современный стек технологий.
  • Выдаем технику для продуктивной работы - ThinkPad.

С радостью пообщаемся с вами!