Обязанности:
- Разрабатывать и поддерживать LLM/RAG-решения для бизнес-задач:
- Интеграция внутренней документации (CRM, техническая база знаний) с LLM через векторные БД;
- Оптимизация релевантности ответов за счет тюнинга эмбеддингов и ранжирования; - Работать с векторными базами данных:
- Настройка и администрирование (QDrant, ChromaDB, pgvector);
- Оптимизация скорости поиска и качества эмбеддингов (выбор моделей, размер chunk’ов, метрик сходства). - Интегрировать сервисы в существующую ИТ-инфраструктуру (API, брокеры сообщений, хранилища данных).
- Создавать API-интеграции для LLM:
- Построение микросервисов на FastAPI для обработки запросов к LLM;
- Интеграция с внешними системами (CRM, чат-боты, аналитические платформы);
- Обеспечение безопасности и аудита запросов (rate limiting, фильтрация данных). - Оптимизировать производительность и масштабируемость разрабатываемых сервисов для высоконагруженных систем.
- Настраивать мониторинг технических и качественных метрик моделей.
- Взаимодействовать с инженерами, аналитиками и продуктовыми командами.
- Экспериментировать с генеративным ИИ:
- RnD/Fine-tuning моделей (open-source Ollama / Cloud LLMs) под нишевые задачи;
- Тестирование новых архитектур (агента на основе AutoGen, multi-agent системы);
- Внедрение cost-эффективных решений (quantization, кэширование ответов).
- Опыт работы с RAG-архитектурами (от проектирования до оптимизации в production).
- Python — продвинутый уровень (от 3 лет), умение писать чистый и поддерживаемый production код (OOP, SOLID), знание фреймворков FastAPI, ORM (sqlalchemy).
- Понимание эмбеддингов: как генерировать, сравнивать, оптимизировать под задачи бизнеса.
- Практический опыт с векторными БД:
- Уверенное использование минимум одной: QDrant, ChromaDB;
- Навыки настройки индексов, гиперпараметров поиска, обработки больших датасетов. - Знание LLM-стека:
- Работа с LangChain, LlamaIndex;
- Понимание принципов prompt engineering, retrieval strategies, reranking;
- Опыт деплоя моделей через vLLM, Text Generation Inference или аналоги. - Навыки API-интеграций:
- Создание REST api-сервисов для LLM;
- Работа с асинхронными запросами, очередями и фоновыми задачами (Celery, RabbitMQ, Redis). - Опыт подготовки моделей к продакшену:
- Docker, CI/CD. - Хорошее знание Linux.
- Опыт работы с GitLab.
- Понимание принципов MLOps и мониторинга (включая Grafana).
- Опыт работы с SQL и NoSQL базами данных.
- Способность самостоятельно разбираться в предметной области и видеть связь технической постановки с бизнес-потребностями.
- Работа на курорте "Роза Хутор";
- Оформление по ТК РФ;
- График работы 5/2 (с 9:00 до 18:00) или гибрид (3/2);
- ДМС со стоматологией после испытательного срока;
- Корпоративный транспорт (из Сочи, Адлера, Хосты, Кудепсты, Веселого, Чайсовхоза, Молдовки, Красной Поляны);
- Мотивационный пакет (доступ к уникальным возможностям курорта, включая пользование канатными дорогами и различными услугами);
- Полугодовой бонус по результатам работы курорта;
- Позиция не подразумевает предоставление жилья.