Okko

Data Engineer (команда RecSys)

Не указана

Москва
Полная занятость
Удаленная работа
От 3 до 6 лет

Python
SQL
Clickhouse
Apache Airflow
Spark

Мы делаем продукт для миллионов пользователей и активно развиваем data-driven подход: запускаем десятки A/B-экспериментов, используем множество источников данных и витрин, а команда инженеров данных помогает всему этому работать быстро, надёжно и масштабируемо.

Сейчас мы ищем Data Engineer в команду рекомендаций. Это направление напрямую влияет на пользовательский опыт и эффективность ML-моделей. У нас получится поработать как с классическим batch-ETL, так и со стриминговой обработкой данных в реальном времени.

Что предстоит делать:

поддерживать и развивать batch ETL-пайплайны на Airflow для аналитических витрин и ML-моделей;
работать с потоковой обработкой: Spark Streaming, Kafka, MongoDB;
развивать feature store - добавлять новые фичи и интегрировать данные для моделей;
оптимизировать и документировать пайплайны, настраивать мониторинг.

Наш стек:

ClickHouse
Airflow
Spark (Spark Streaming, PySpark, Spark SQL)
Kafka
MongoDB
Hive
S3
DataHub

Требования:

уверенное знание Python и SQL;
опыт построения ETL-процессов с использованием перечисленного стека;
будет плюсом: опыт работы с CI/CD, Docker, Grafana.

Условия:

работа в сильной команде, состоящей из топовых аналитиков, аналитиков-разработчиков и инженеров;
топовое оборудование и весь необходимый софт;
официальное трудоустройство;
ДМС со стоматологией, офисный врач, доплата больничного листа, корпоративные скидки;
льготные условия ипотеки в рамках зарплатного проекта;
бесплатная подписка на сервисы партнеров.
насыщенная корпоративная жизнь.

Источник вакансии

Вернуться, к списку вакансий