В нашей IT-команде уже больше 850 специалистов, которые постоянно совершенствуют свои навыки. Мы не стоим на месте — постоянно улучшаем процессы разработки (ATDD, CI/CD и другие), пробуем новые подходы и развиваем команду. Нам важно, чтобы каждый сотрудник продолжал расти, поэтому мы проводим внутренние митапы, хакатоны, развиваем гильдии по направлениям и поддерживаем обучение за пределами компании. У нас есть много возможностей для профессионального развития и не только.
О проекте:
Сейчас мы ищем Data scientist в команду "Инновационные технологии". Команда помогает бизнесу автоматизировать ручные процессы, улучшать SLA, увеличивать показатель NPS, снижать убыточность и экономить на расходах, с помощью технологий: openRPA, Python 3.11+, OCR, NLU, NLP. А также команда занимается разработкой цифровых помощников (RPA), сервисов и различных пилотных проектов в направлении Финтеха и Инноваций.
Стек:
Python 3.11+, openRPA, OCR, NLU, NLP, Selenium, pyAutoGUI, pydantic, Pandas, Openpyxl, FastAPI, БД PostgreSQL.
Чем предстоит заниматься:
- Разработка и контроль качества решений на всех этапах проекта: анализ, проектирование, разработка, тестирование, документация;
- Взаимодействие с бизнес-заказчиками и командой, согласование документации, постановка и проработка технических задач совместно с аналитиками и продакт-менеджерами;
- Выбор архитектур, фреймворков и инструментов под задачи;
- Сбор, разметка, очистка и аугментация данных для ML/CV;
- Имплементация и поддержка backend-компонентов на Python для ML/CV-сервисов;
- Анализ производительности и оптимизация решений для ускорения инференса, включая экспорт, сжатие и квантование моделей;
- Оценка метрик качества моделей, анализ ошибок и доработка;
- Написание технической документации, подготовка описаний пайплайнов и архитектуры, участие в код-ревью и обмене знаниями; оценка сроков и трудоемкости задач, отчетность о ходе работ и результатах;
- Отслеживание современных трендов в ML/CV и тестирование новых подходов для повышения эффективности решений.
Что мы ждем:
- Коммерческий опыт разработки на Python от 2 лет;
- уверенное владение numpy, pandas, scikit-learn и PyTorch и/или TensorFlow;
- Практический опыт в CV/OCR: препроцессинг изображений, аугментации, разметка;
- Опыт решения задач классификации, детекции, сегментации и трекинга;
- Навыки обучения, дообучения и внедрение моделей (CNN, трансформеры и др.), построения end-to-end пайплайнов;
- Опыт подготовки/анализа данных, разметки, обучения/валидации/тест, деплой;
- Инструменты: CVAT (администрирование приветствуется), OpenCV, Pillow, torchvision;
- Опыт экспорта и оптимизации моделей — ONNX, TorchScript, TensorRT;
- Опыт ускорения инференса, сжатия и квантования.