
Университет ИТМО
Middle AI Engineer
- Python
- pandas
- Numpy
- SciPy
- Matplotlib
- Plotly
- NLTK
- spaCy
- LangChain
- Ollam
- LlamaIndex
- PostgresSQL
- MongoDB
- Linux
- Gitlab
- Git
- SQL
- Docker
- API
- FastAPI
- Flask
- DoWhy
- CausalML
- Английский — B2 — Средне-продвинутый
Приглашаем Middle AI Engineer для участия в инновационном R&D-проекте по разработке интеллектуального агента на базе LLM. Цель проекта – создать прототип системы, которая оценивает эффект управленческих интервенций (uplift-моделирование) и генерирует объяснения причинно-следственных связей на естественном языке с помощью RAG.
Проект осуществляется в сотрудничестве с крупным промышленным партнером и объединяет методы LLM, каузального вывода и графов знаний. Это отличная возможность поработать с современными технологиями ИИ.
Примеры задач:
-
Проведение обзора литературы и экспериментов: анализ современных методов применения LLM для выявления причинно-следственных связей и объяснения результатов моделей.
-
Установление связей «причина-следствие» в данных на основе статистических методов и здравого смысла. Исследование влияния различных признаков на эффективность маркетинговых кампаний.
-
Реализация методов оценки эффекта от различных бизнес-интервенций.
-
Построение причинно-следственного графа по данным. Оценка устойчивости графа при обновлении данных.
-
Разработка алгоритма преобразования причинно-следственного графа в формат, оптимальный для использования в контексте LLM
-
Реализация RAG-пайплайна для LLM, передача релевантных фактов и узлов графа в промпт.
-
Разработка модуля объяснения решений: программирование генерации текстовых отчетов, где агент обосновывает, за счет каких факторов и как именно выбранная интервенция повлияет на целевую метрику.
-
Тестирование модели на ретроспективных данных, сравнение предсказанных эффектов с фактическими, анализ ошибок модели и улучшение качества интерпретаций.
Обязанности:
-
сбор, подготовка и проверка корректности датасетов. Построение причинно-следственного графа факторов, влияющих на ключевые бизнес-показатели, и статистическая проверка выявленных связей;
-
тестирование качества работы агента на исторических данных, оценка точности прогнозов и объяснений, внедрение метрик качества;
-
проектирование и реализация архитектуры агента, который будет обрабатывать запросы пользователей, интегрировать внешние данные и выдавать интерпретируемые ответы;
-
настройка RAG для поиска и извлечения релевантной информации для обогащения контекста LLM; подключение данных из причинно-следственного графа к модели для повышения достоверности ответов и снижения "галлюцинаций";
-
моделирование эффектов интервенций. Реализация алгоритмов расчета uplift-эффекта с помощью LLM. Сравнительный анализ влияния различных вмешательств на бизнес-показатели;
-
тестирование LLM с целью генерации корректных причинно-следственных интерпретаций;
-
документирование выполненных решений.
Обязательные используемые технологии:
- Python;
- библиотеки для анализа: pandas, numpy, scipy, statsmodels;
- инструменты визуализации: matplotlib, plotly;
- библиотеки для обработки естественного языка: NLTK и spaCy;
- LLM: LangChain, Ollam, LlamaIndex.
- базы данных: PostgresSQL, MongoDB, векторные БД;
- опыт работы в Linux-среде, системами контроля версий (git, GitLab) и контейнирования (Docker);
- опыт разработки API (FastAPI/Flask).
-
опыт работы с графовыми структурами, знание графовых БД и библиотек (например, NetworkX или PyGraphviz) для создания и хранения причинно-следственных графов;
-
опыт каузального анализа и причинного вывода (например, DoWhy, CausalML);
-
опыт uplift-моделирования.
Требования:
- оконченное высшее образование по направлению компьютерные науки, прикладная математика, анализ данных;
-
умение и желание извлекать, очищать и готовить сырые текстовые данные для моделирования;
-
уверенное чтение и понимание статей по теме LLM и документации на английском языке;
-
углубленное понимание принципов работы LLM и практический опыт построения систем на базе LLM (в т. ч. агентных) от 1 года;
-
навык развертывания локальных LLM моделей, prompt engineering, RAG, few-shot learning;
-
уверенные навыки программирования на Python, умение писать чистый и эффективный код;
-
умение использовать предобученные модели, адаптировать их под задачи (fine-tuning, LoRA, prompt tuning);
-
аналитический склад ума, умение разбираться в сложных новых концепциях; инициативность и способность предлагать улучшения; умение работать в команде R&D и эффективно коммуницировать результаты стейкхолдерам.
-
интерес к методам каузального вывода и анализу A/B-тестов/интервенций;
-
опыт с uplift-моделированием, причинно-следственными графами или оценкой эффектов в бизнесе.
Условия:
-
офис банка-партнера на Василеостровском острове;
-
срочный трудовой договор до декабря 2025 года с возможностью продления;
-
предоставляем все необходимые вычислительные ресурсы для комфортной работы с моделями и данными;
-
работа в команде под руководством опытного тимлида, дружелюбная атмосфера, обмен знаниями, участие в обсуждении архитектурных решений;
-
участие в передовом исследовательском проекте совместно с одним из лидеров отрасли (банком-партнером); возможность публикаций и выступлений по итогам проекта, рост экспертизы в области LLM и каузального ИИ.