ВСК, САО

Data Scientist (NLP/CV)

Не указана
  • Москва
  • Полная занятость
  • Полный день
  • От 3 до 6 лет

В нашей IT-команде уже больше 850 специалистов, которые постоянно совершенствуют свои навыки. Мы не стоим на месте — постоянно улучшаем процессы разработки (ATDD, CI/CD и другие), пробуем новые подходы и развиваем команду. Нам важно, чтобы каждый сотрудник продолжал расти, поэтому мы проводим внутренние митапы, хакатоны, развиваем гильдии по направлениям и поддерживаем обучение за пределами компании. У нас есть много возможностей для профессионального развития и не только.

О проекте:

Сейчас мы ищем Data scientist в команду "Инновационные технологии". Команда помогает бизнесу автоматизировать ручные процессы, улучшать SLA, увеличивать показатель NPS, снижать убыточность и экономить на расходах, с помощью технологий: openRPA, Python 3.11+, OCR, NLU, NLP. А также команда занимается разработкой цифровых помощников (RPA), сервисов и различных пилотных проектов в направлении Финтеха и Инноваций.

Стек:

Python 3.11+, openRPA, OCR, NLU, NLP, Selenium, pyAutoGUI, pydantic, Pandas, Openpyxl, FastAPI, БД PostgreSQL.

Чем предстоит заниматься:

  • Разработка и контроль качества решений на всех этапах проекта: анализ, проектирование, разработка, тестирование, документация;
  • Взаимодействие с бизнес-заказчиками и командой, согласование документации, постановка и проработка технических задач совместно с аналитиками и продакт-менеджерами;
  • Выбор архитектур, фреймворков и инструментов под задачи;
  • Сбор, разметка, очистка и аугментация данных для ML/CV;
  • Имплементация и поддержка backend-компонентов на Python для ML/CV-сервисов;
  • Анализ производительности и оптимизация решений для ускорения инференса, включая экспорт, сжатие и квантование моделей;
  • Оценка метрик качества моделей, анализ ошибок и доработка;
  • Написание технической документации, подготовка описаний пайплайнов и архитектуры, участие в код-ревью и обмене знаниями; оценка сроков и трудоемкости задач, отчетность о ходе работ и результатах;
  • Отслеживание современных трендов в ML/CV и тестирование новых подходов для повышения эффективности решений.

Что мы ждем:

  • Коммерческий опыт разработки на Python от 2 лет;
  • уверенное владение numpy, pandas, scikit-learn и PyTorch и/или TensorFlow;
  • Практический опыт в CV/OCR: препроцессинг изображений, аугментации, разметка;
  • Опыт решения задач классификации, детекции, сегментации и трекинга;
  • Навыки обучения, дообучения и внедрение моделей (CNN, трансформеры и др.), построения end-to-end пайплайнов;
  • Опыт подготовки/анализа данных, разметки, обучения/валидации/тест, деплой;
  • Инструменты: CVAT (администрирование приветствуется), OpenCV, Pillow, torchvision;
  • Опыт экспорта и оптимизации моделей — ONNX, TorchScript, TensorRT;
  • Опыт ускорения инференса, сжатия и квантования.