ICL Soft (ГК ICL) - лидирующая российская ИТ компания по разработке ПО и собственных программных продуктов, внедрению и поддержке корпоративных решений, а также комплексной технической поддержке и аутсорсингу бизнес процессов.
Мы ищем Data Scientist, который войдет в команду по созданию передового семейства ИИ-ассистентов. Эта вакансия позволяет не просто решать локальные задачи, а активно участвовать в создании продукта нового поколения. Вы сможете внедрить свои идеи, которые станут основой для интеллектуальных систем в одной из самых динамичных отраслей.
Что предстоит делать:
• Разрабатывать, обучать и адаптировать большие языковые модели (LLM) для создания различных специализаций в рамках семейства ИИ-ассистентов.
• Проектировать, реализовывать и оптимизировать высокоэффективные системы RAG (Retrieval-Augmented Generation) для обеспечения точных, релевантных и обоснованных ответов.
• Создавать и внедрять сложных ИИ-агентов, способных к автономному выполнению задач, планированию действий и взаимодействию с внешними системами.
• Проверять гипотезы, оптимизировать модели и обеспечивать их внедрение в платформу
• Участвовать в проектировании архитектуры масштабируемого и производительного ядра на основе генеративного ИИ для всего семейства ассистентов.
• Сотрудничать с инженерами и продуктовыми командами для интеграции интеллектуальных моделей в конечный продукт.
• Разрабатывать инновационные подходы к взаимодействию с пользователем, определяющие возможности ассистентов в долгосрочной перспективе.
Что мы ожидаем от Вас:
• Практический опыт в Data Science / Machine Learning от 2-х лет.
• Опыт работы с Large Language Models (LLM): тонкая настройка (fine-tuning), специфические подходы к обучению (например, QLoRA), создание эффективных промптов.
• Глубокое понимание и практический опыт построения RAG-систем (включая работу с векторными базами данных, чанкинг, ранжирование).
• Опыт проектирования и разработки ИИ-агентов (AI Agents) с использованием фреймворков (LangChain, LlamaIndex и аналоги).
• Отличное знание Python и стека ML-библиотек (pandas, numpy, xgboost, PyTorch, Transformers, Hugging Face и др.).
• Умение работать со сложными данными и проектировать сквозные ML-пайплайны.
• Опыт взаимодействия с продуктовыми и аналитическими командами для определения требований;
Будет плюсом:
• Опыт работы с задачами обработки и анализа голосовых данных (ASR, TTS, извлечение инсайтов из аудио).
• Опыт работы с MLOps и автоматизацией пайплайнов (например, MLflow) для LLM.
• Навыки работы с Docker и Kubernetes для развертывания моделей.
• Знание архитектурных решений для работы с большими данными (Spark, Dask, etc.).
Что мы предлагаем:
Выплаты и бонусы:
• Конкурентная заработная плата +13 зарплата (годовой бонус);
• ДМС со стоматологией;
• Компенсация спорта, скидки в фитнес-клубах;
• Бонус к отпуску.
Условия труда:
• Удаленный формат работы;
• Предоставление рабочей техники (ноутбук, гарнитура).
Обучение и карьера:
• Вендорное обучение и сертификация за счет компании;
• Возможность участия в техническом и управленческом кадровом резерве.
Экология и благотворительность:
• Помогаем детским домам, школам, приютам для животных;
• Озеленяем город, бережем ресурсы;
• Поддерживаем социальные инициативы сотрудников;
• Поддерживаем социальные инициативы сотрудников.