Формат работы: удалённо
График: удаленный
Подчинение: IT директор
О вакансии
Мы ищем Middle Data Warehouse инженера с опытом проектирования и реализации хранилищ данных, а также техническим видением, способным не только решать задачи руками, но и вести за собой команду.
Это роль "играющего тренера" — ты будешь не только разрабатывать и оптимизировать решения, но и координировать команду, управлять подрядчиками, принимать технические решения и задавать вектор развития.
Мы строим централизованное хранилище данных — с интеграцией BI, AI-инструментов и автоматизацией аналитики.
Что предстоит делать
-
Проектировать и реализовывать архитектуру DWH.
-
Разрабатывать и оптимизировать ETL/ELT-процессы (используем Airflow, Python, PostgreSQL — процедуры, разложенные по слоям).
-
Централизовывать корпоративные данные (объём хранилища сейчас ~200 GB, потенциально вырастет до 2–3 TB).
-
Интегрировать данные из 20+ источников (основных 3–4, где сосредоточено ~80% всей информации).
-
Внедрять BI-решения (Power BI).
-
Подключать AI-инструменты (в будущем: генерация дашбордов, авто-SQL, NLP-интерфейсы).
-
Писать DDL/DML, схемы, процедуры, документацию.
-
Руководить небольшой командой (3 инженера + подрядчик), распределять задачи, контролировать качество и сроки.
-
Участвовать в выборе технологий, настройке CI/CD (GitLab).
-
Работать с объектным хранилищем (S3), где сейчас лежит телеметрия из ClickHouse.
Мы ожидаем от тебя
-
3+ лет опыта с DWH.
-
Отличное знание SQL и понимание архитектуры хранилищ.
-
Опыт с Airflow или аналогичными оркестраторами.
-
Навыки построения BI-дешбордов (Power BI, Tableau и др.).
-
Умение самостоятельно брать задачи «под ключ».
-
Интерес к применению AI в аналитике.
В данный момент у нас
-
Команда состоит из 3 человек + подрядчик.
-
Разработано техническое задание на архитектуру, ведётся реализация.
Что мы предлагаем
-
Влияние: ты будешь главным техническим голосом в проекте.
-
Масштаб: возможность построить современное хранилище с нуля.
-
Автономность и доверие: минимум бюрократии.
-
Современный стек: Airflow, Python, PostgreSQL, Power BI, GitLab CI/CD, S3, AI-интеграции.
-
Гибкость: работа удалённо.