В связи с развитием бизнеса мы начинаем серьёзную модификацию платформы управления данными. В рамках этого проекта сформирован пул задач, который заинтересует дата-инженеров и опытных аналитиков данных.
Вся рутинная работа автоматизирована, поэтому в команду требуются активные разработчики, готовые решать сложные и нестандартные задачи.
Мы ищем людей, стремящихся развиваться, изучать и внедрять новые технологии.
Можем предложить задачи (в зависимости от опыта и желаний):
- Поиск источников данных и исследование данных на корректность перед загрузкой в ХД
- Настройка ETL/ELT процессов для выгрузки данных в ХД
- Подготовка витрин данных для аналитиков
- Автоматизация доступа к данным ХД/витрин (column_level, row_level)
- Оркестрация ETL/ELT
- Визуализация data lineage
- Качество данных (Data Quality)
- Создание дашбордов в BI
- Работа с API сервисами
- Подбор и внедрение новых инструментов для работы с данными
- Перенос данных и пайплайнов на новую платформу данных
Основной стек: Git, MSSQL, SSAS, clickhouse, Python, DBT, PowerBI, Airflow
Ожидания от опыта:
- Знание методологий моделирования ХД (3NF, DataVault, AnchorModeling и др.) Отличное владение SQL (основной объём данных в MSSQL)
- Богатый опыт ETL/ELT
- DBT
- Python
Будет плюсом:
- Опыт работы с OLAP кубами
- Опыт создания семантического слоя (например на базе cube.js)
- Работа с MPP субд (greenplum, clickhouse, YDB)
- Опыт работы с брокером сообщений (Kafka)
Мы предлагаем:
- Трудоустройство в штат аккредитованной ИТ-компании
- Полностью удаленный формат работы в рамках московского времени
- Онлайн марафоны, выступления интересных спикеров, возможность пользоваться корпоративной библиотекой
- Поддержку инициатив, профессиональную прокачку и классную команду.