Лига Цифровой Экономики

Data Engineer (Scala)

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет
  • Scala
  • Apache Spark

Лига в поисках Разработчика на проект крупного российского банка (ТОП-3). Команда проекта занимается аналитикой данных контрагентов банка для расчета факторов кредитного риска.
Стек - Arenadata DB, Greenplum, Spark, Scala.

Твои задачи:

  • Сделать приложение для построения витрин данных с использованием Apache Spark
  • Оптимизировать и доработать существующие приложения на Apache Spark
  • Взаимодействовать с заказчиками и аналитиками в ходе проектирования и реализации задач
  • Разработать пайплайны загрузки данных в Airflow

Что мы ждем от тебя:

  • Опыт разработки на языке Scala
  • Создание и поддержка витрин данных хранилища (DWH), используя технологии Apache Spark
  • Практический опыт работы хотя бы с одной из перечисленных баз данных: Oracle, PostgreSQL, IBM DB2, Arenadata DB, GreenPlum
  • Понимание особенностей организации распределенных вычислительных процессов (желательно наличие опыта работы с Hadoop-кластерами)
  • Владение инструментами экосистемы BigData, такими как Hadoop, Spark SQL, Airflow
  • Глубокое понимание структуры данных, эффективных алгоритмов и запросов SQL

Будет плюсом:

  • Знания Kafka
  • Понимание подходов к организации разработки (CI/CD, DEVops)
Что мы предлагаем:
  • Возможность работы в удаленном формате
  • Сессия профессионального развития персонала дважды в год, результатом которой является план индивидуального развития каждого сотрудника
  • Технику для комфортной работы
  • Поездки на конференции и тренинги за счет компании, внутренние семинары, внутренние митапы, мы очень любим учиться новому
  • Сообщества по интересам, а также возможность организовать свое сообщество и получить поддержку от компании
  • Корпоративная культура со своими ценностями и традициями, в которой каждый чувствует себя частью команды