Сейчас мы ищем Senior Machine Learning Engineer к нашему партнеру «Даталаб».
Даталаб — IT-компания, которая разрабатывает сложные решения в области искусственного интеллекта и предоставляет услуги аутстаффинга профессиональных команд. Наши клиенты — технологические компании по всему миру. Мы строим долгосрочные и надежные отношения как с заказчиками, так и с нашими специалистами.
Что предстоит делать:
Основной фокус работы
-
Разработка и оптимизация решений на базе LLM (GPT-4, Claude,и др.)
-
Проектирование и реализация RAG (Retrieval-Augmented Generation) систем
-
Разработка multi-agent систем и оркестрация LLM для сложных задач
-
Создание и оптимизация prompt engineering стратегий
Исследования и разработка
-
Дизайн и проведение экспериментов по оценке качества LLM решений
-
Разработка метрик и бенчмарков для оценки генеративных моделей
-
Исследование и внедрение техник улучшения качества генерации (Chain-of-Thought, Few-shot learning, Self-consistency)
-
Написание production-ready кода для LLM-пайплайнов
Работа с данными и системами
-
Проектирование и реализация векторных баз данных для семантического поиска
-
Разработка систем обработки и индексации документов
-
Создание пайплайнов для оценки качества и мониторинга LLM в production
-
Оптимизация латентности и стоимости использования LLM API
Внедрение и коллаборация
-
Тесное взаимодействие с продуктовой командой для интеграции LLM решений
-
Разработка API и микросервисов для LLM-функциональности
-
Участие в code review и менторинг junior-специалистов
-
Создание документации и best practices по работе с LLM
Развитие экспертизы
-
Мониторинг новых моделей и техник в области генеративного ИИ
-
Изучение и анализ актуальных научных публикаций
-
Тестирование и оценка новых LLM API и инструментов
Ждем от тебя:
Обязательные навыки
-
Глубокое понимание архитектуры современных LLM и принципов их работы
-
Практический опыт работы с LLM API (минимум 2 года):
-
OpenAI API
-
Anthropic Claude
-
Open-source модели через Hugging Face Inference API
-
-
Экспертиза в prompt engineering и оптимизации промптов
-
Опыт построения RAG-систем:
-
Векторные базы данных (Qdrant, ChromaDB)
-
Embedding модели и семантический поиск
-
Chunking стратегии и обработка документов
-
-
Владение фреймворками для работы с LLM:
-
LangChain/LlamaIndex
-
Semantic Kernel
-
DSPy или аналоги
-
-
Python: продвинутый уровень, асинхронное программирование, clean code
-
Опыт разработки API (FastAPI, Flask) и микросервисной архитектуры
Дополнительные преимущества
-
Опыт работы на аналогичной позиции в продуктовой компании
-
Знание методов оценки качества генерации (BLEU, ROUGE, BERTScore, LLM-as-a-judge)
-
Опыт работы с multi-modal моделями (vision-language models)
-
Участие в хакатонах по генеративному ИИ
-
Научные публикации в области NLP/LLM
-
Опыт оптимизации затрат на LLM API и кэширования
-
Знакомство с инструментами мониторинга LLM (Weights & Biases, LangSmith, Phoenix)
-
Опыт работы с streaming responses и real-time генерацией