Чем предстоит заниматься:
- проектированием и разработкой архитектуры сложных ML решений на базе LLM для ключевых бизнес-задач компании;
- руководством процесса выбора, дообучения и оптимизации SOTA LLM (включая оценку производительности, стоимости, рисков, оборудования);
- исследованием и внедрением передовых техник и подходов в области LLM (включая различные методы fine-tuning, evaluation, quantization, distillation);
- разработкой и внедрением робастных пайплайнов для обучения, оценки, развертывания и мониторинга LLM-решений (практики MLOps) – желательно;
- оптимизацией LLM-моделей для масштабирования - ускорение и т.д.;
- менторством и техническим ревью для миддл- и джун-специалистов;
- участием в формировании технической стратегии команды в области LLM и AI в целом;
- взаимодействием с командой для интеграции AI-решений в продукты и процессы компании;
- при необходимости, глубоким погружением и решением сложных задач в смежных областях ML (желательно).
- опыт работы в роли ML Engineer / DS от 3 лет, с фокусом на NLP/LLM в последние 1-2 года;
- уверенное знание python (как минимум, для уверенного ревью кода);
- экспертное владение фреймворками глубокого обучения (PyTorch или TensorFlow);
- глубокий практический опыт работы с экосистемой Hugging Face и/или другими инструментами для LLM;
- подтвержденный опыт успешного дообучения и внедрения (или доведения до продакшн состояния) нескольких LLM в реальных проектах;
- глубокое понимание архитектур LLM, различных методов pre-training, fine-tuning;
- опыт оптимизации моделей для инференса (например, quantization);
- способность самостоятельно проводить исследования, предлагать и валидировать новые подходы.