Ecom.tech

Middle MLE (LLM)

Не указана

Москва
Полная занятость
Полный день
От 1 года до 3 лет

Python
FastAPI
Flask
PyTorch

Сейчас мы в поиске Middle Machine Learning Engineer (LLM) в проект по автоматизации работы разработчиков, тестировщиков, техлидов и системных аналитиков.

О команде:

Наша цель - это автоматически выполнять рутинные , но полноценные бизнес задачи. Это поможет снять скучные задачи с людей и позволит им делать действительно классные штуки! В этом проекте используются только SOTA решения (Самые последние LLM, фреймворки и практики по организации производственных процессов).
Второе направление - это помощь в создании утилит для отделов в компании. Мы не только хотим добиться автономности в выполнении определенного класса задач, но и помогаем другим отделам делать их задачи удобнее. Мы создаем ботов и другие небольшие приложения, которые помогают коллегам в их работе.

Чем предстоит заниматься:

Тебе придется оборачивать решения от DataScience в полноценные сервисы, которые должны работать стабильно, эффективно и правильно. От DS приходит прототип сервиса, никаких Jupyter noteook..
Тебе предстоит деплоить свои сервисы: собирать образы, вникать в инфраструктуру компании (естественно совместно с наставником), поднимать сервисы в k8s, настраивать мониторинг. Если подобное уже реализовывал в своих проектах, то, пожалуйста, подсвети это нам.
Будут задачи, где придется разбираться с видеокартами и CUDA. Много ресерча, экспериментов и боли..
Создавать быстро ботов/мини приложения. Это отдельные задачи, где мы не будем гнаться за стабильностью. Нужно будет быстро поднять утилиту, чтобы при маленькой нагрузке все работало.

От успешного соискателя мы ожидаем:

Опыт разработки от 1.5 года на Python (обязательно), Golang (будет плюсом).
Опыт работы с БД (SQL, NoSQL) и Kafka.
Фреймворки FastApi, Flask.
Git, docker.
Базовые знания k8s (понимание абстракций и как с ними работать).
Самостоятельность. Будет довольно много задач, где придется разбираться самому.

Будет плюсом:

Опыт с разворачиванием LLM моделей (sglang, vllm).
Опыт работы с библиотеками и техниками оптимизации ML моделей (onnx, TensorRT, квантизация и т.д.).
Прописыванием своих пайплайнов CI/CD.

Стек:

Python, FastApi/Flask, Kafka, Docker, GIT.
k8s, sglang/vllm, PyTorch, Triton.

Источник вакансии

Вернуться, к списку вакансий