
WILDBERRIES
Lead Data Scientist в Know Your Employee [Trust and Safety]
- Машинное обучение
- Python
- PyTorch
- Docker
- Kubernetes
- MLflow
- CV
- Audio ML
- NLP
Wildberries и Russ — лидер рынков e-commerce и наружной рекламы в России и странах СНГ.
Ежедневно более 4 тысяч наших IT-специалистов создают цифровую экосистему, состоящую из сотен тысяч продуктов. На сегодня мы создали крупнейшую онлайн-платформу для покупки и продажи товаров в России и странах СНГ.
Вместе с масштабным развитием IT-направления мы формируем культуру Trust and Safety, гарантируя непрерывную безопасность и доверие между компанией, её сотрудниками, пользователями и клиентами.
Мы создаём платформу для многофакторной оценки надёжности и выявления рисков при взаимодействии людей с компанией. Цель — в реальном времени обнаруживать аномалии, несоответствия и потенциально мошеннические действия, анализируя мультимодальные данные (документы, текст, аудио, видео и метаданные). Продукт на стыке ML, безопасности и продукта; важен баланс точности, скорости и требований privacy/compliance.
Наши задачи:
• Сформировать ML-стратегию и дорожную карту совместно с продуктом и безопасностью; определить метрики качества и стоимости ошибок
• Спроектировать архитектуру решений для анализа мультимодальных сигналов (текст/аудио/видео/метаданные), включая fusion-подходы, sequence/graph-модели
• Выстроить ML lifecycle: набор данных и data contracts, feature store, offline/online оценка, A/B/Shadow, калибровка, мониторинг дрейфа и качества, retraining
• Обеспечить инженерные практики: reproducibility, объяснимость (XAI), CI/CD для моделей, observability, SLO по латентности и доступности
• Руководить командой 3 Senior DS: менторинг, ревью, приоритизация, найм, развитие. Синхронизироваться с платформой и бэкендом: API, стриминг/оркестрация, безопасность данных и соответствие политикам
Необходимые опыт и навыки:
• 5+ лет в DS/ML, подтверждённый продакшн-опыт с измеримым бизнес-эффектом
• Глубокая экспертиза минимум в одной области: multimodal ML, ASR/Audio ML, CV, NLP, anomaly/fraud detection, graph ML
• Опыт построения end-to-end ML-систем: от данных и фич до low-latency инференса и мониторинга
• Уверенный Python/SQL; стек: PyTorch/TF; контейнеры и оркестрация (Docker/K8s); трекинг экспериментов (MLflow/W&B)
• Спарк/стриминг — плюс
• Понимание privacy-by-design, PII/consent management, auditability, требований к объяснимости
• Опыт лидерства: управление командой, работа со стейкхолдерами (безопасность, юристы, платформа, продукт)
Будет плюсом, если у тебя есть:
• Опыт trust & safety/антифрод, proctoring-like решений, voice/face anti-spoofing, behavioral biometrics
• Практика real-time/stream processing (Kafka/Flink), feature stores, оптимизации инференса под CPU/GPU
• Опыт противодействия обходам (adversarial thinking, red teaming ML), robust ML
• Полная удаленка или свободное посещение офисов в Москве и Санкт-Петербурге
Наш процесс найма:
• 30-минутное HR интервью, чтобы рассказать о себе и узнать больше о вакансии