CRT

LLM Engineer (Python, RAG)

От 200 000 RUR
  • Санкт-Петербург
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет
  • Python
  • LLM
  • RAG
  • Git
  • LoRA / QLoRA
  • vLLM / TGI

О компании:
Мы представляем компанию, занимающуюся разработкой сервиса по быстрому и качественному созданию презентационных материалов. Система работает с высокими нагрузками, ежедневно обслуживая около 20 000 пользователей.

Компания внесена в реестр аккредитованных IT-компаний

Будет плюсом, если в сопроводительном письме укажете свой Telegram.

Чем предстоит заниматься:
– Разворачивать и поддерживать LLM-модели в корпоративном контуре на базе Qwen, Llama, Mistral и аналогов
– Проектировать и реализовывать RAG-системы
– Интегрировать LLM в основной продукт компании — редактор презентаций
– Выполнять дообучение LLM-моделей (LoRA или QLoRA)
– Оптимизировать запросы к модели для снижения количества используемых токенов
– Писать и поддерживать техническую документацию

Что мы ждём от кандидата:
– Коммерческий опыт разработки на Python на уровне middle или выше
– Опыт развёртывания LLM-моделей в локальном или корпоративном контуре
– Опыт дообучения LLM-моделей (методами LoRA или QLoRA)
– Практический опыт проектирования и внедрения RAG-систем
– Уверенная работа с Git в командной разработке

Будет преимуществом:
– Опыт работы с vLLM, TGI, Ollama, HuggingFace Inference
– Работа с векторными базами Qdrant, Milvus, Weaviate
– Опыт оптимизации производительности LLM-сервисов
– Базовое понимание Docker, Linux и GPU-окружения

От компании:
– Официальное трудоустройство в аккредитованную IT-компанию.
– График работы 5/2 с возможностью гибкого начала и окончания рабочего дня.
– Полностью официальная заработная плата без задержек, с плановым увеличением в течение 2-х лет.
– Удаленный формат работы.