Обязанности:
- Разработка шаблонизированных ETL/ELT процессов;
- Сопровождение Apache Spark / PySpark jobs;
- Поддержка ETL/ELT-процессов для DWH;
- Пакетная обработка данных (batch processing);
- Оркестрация и автоматизация пайплайнов с помощью Apache Airflow;
- Очистка, трансформация и агрегация данных;
- Оптимизация производительности Spark-задач (конфигурации, партиционирование, масштабируемость);
- Развитие моделей данных DWH;
- Использование платформ хранения данных;
- Управление миграциями схем БД с использованием Liquibase;
- Работа с брокерами сообщений в рамках data-pipeline;
- Поддержка и развитие существующих data-решений.
-
Опыт работы ETL / Data Engineer от 3 лет
-
Опыт работы с хранилищами данных (DWH)
-
Понимание принципов построения и эксплуатации data-платформ
-
Опыт промышленной эксплуатации data-pipeline
-
Умение работать в распределённых системах обработки данных
- Профессиональный коллектив;
- Неограниченный рост;
- Бонусы и уникальные предложения от компаний холдинга;
- Спонсирование профессионального обучения.