Обязанности:
- Проектирование и разработка ETL-потоков, витрин данных, отчетов.
- Очистка и стандартизация сырых данных, разработка проверок качества данных.
- Разработка алгоритмов, обрабатывающих большое количество файлов с данными (xlsx, xml, csv).
- Интеграция аналитического хранилища с другими автоматизированными системами банка.
- Оптимизация и автоматизация процессов работы с данными.
- Проектирование архитектуры решений для реализации бизнес-требований.
- Сопровождение существующей функциональности дата-платформы;
Анализ и мониторинг производительности. - Внедрение современных практик и инженерных подходов.
- Регулярное взаимодействие с бизнесом по задачам с целью уточнить требования.
-
Продвинутые знания теории БД, SQL (PostgreSQL, PL/SQL), Python 3.8+, AirFlow.
-
Знание Python-библиотек для работы обработки данных (Pandas/Dask/PySpark, Numpy) и визуализации(Matplotlib/Seaborn/Plotly).
-
Навыки работы с Jupyter (notebook, lab, hub).
-
Опыт работы с большим количеством файлов с данными (xlsx, xml, csv).
-
Опыт работы с BI-инструментами.
-
Основные команды Git, базовое понимание CI/CD.
-
Знания различных типов архитектуры хранилищ, ETL/ELT-инструментов и принципов работы с данными.
-
Умение покрывать код и артефакты разработки документацией.
-
Английский, достаточный для чтения и понимания документации.
Условия:
- Оформление согласно ТК РФ.
- ДМС со стоматологией.
- Совмещаем работу в офисе и удаленно.
- Офис на территории Москва-Сити.