ЧЕМ ВЫ БУДЕТЕ ЗАНИМАТЬСЯ:
- Обучать модели в OCR-пайплайне: CNN, VLM, LLM;
- Обучать модели для NLP-пайплайнов: классификация документов, NER, доменная адаптация;
- Выдвигать и проверять гипотезы при реализации задач машинного обучения;
- Участвовать в проработке архитектуры ml-пайплайнов;
- Развивать генератор синтетических данных для обучения OCR-моделей;
- Готовить модели для инференса и вывода в промышленную эксплуатацию.
МЫ ЖДЕМ, ЧТО ВЫ:
- Имеете коммерческий опыт работы с задачами компьютерного зрения и NLP от 1–2 лет;
- Работали с задачами: OCR (распознавание текста), детекции объектов, сегментации изображений;
- Работали с мультимодальными моделями (Vision-Language Models, VLM);
- Занимались выводом CV-моделей в продакшн (deployment, мониторинг, поддержка);
- Знаете и имеете опыт решения ключевых задач NLP: классификация текстов, NER, суммаризация, поиск и др.;
- Применяли классические методы (TF-IDF, word2vec и др.) и современные подходы (transformer-based модели);
- Работали с Large Language Models (LLM), VLM не менее года;
- Занимались дообучением моделей: с использованием адаптеров (LoRA, PEFT и др.) и full fine-tuning.
БУДЕТ ПЛЮСОМ, ЕСЛИ ВЫ:
- Занимались построением решений на базе LLM, VLM: чат-боты, RAG-системы, агентные пайплайны;
- Имеете опыт вывода LLM, VLM в продакшн, ускорения и оптимизации моделей квантизация, pruning, batching и др.;
- Работали с мультимодальными пайплайнами (CV + NLP + LLM);
- Занимались построением end-to-end ML систем.
ЧТО МЫ ПРЕДЛАГАЕМ:
- Достойный уровень вознаграждения;
- ДМС со стоматологией с первого месяца работы;
- Отпуск 33 дня;
- Полное соблюдение ТК РФ.