Обязанности:
- Сбор, обработка и анализ больших массивов данных;
- Разработка и поддержка процессов ETL;
- Проведение статистического анализа данных;
- Создание и поддержка аналитических отчетов;
- Анализ проблем в алгоритмах, предложение пути их решения и подготовка тест-кейсов;
- Разработка технических заданий на создание аналитических систем;
- Создание методологической документации;
- Описание бизнес-процессов и требований к данным;
- Формирование инструкций для пользователей;
- Написание сложных SQL-запросов;
- Обработка данных с использованием PySpark;
- Работа с распределенными системами хранения данных;
- Оптимизация процессов обработки данных.
Требования:
- Уверенное знание SQL (продвинутый уровень);
- Уверенное знание Python (продвинутый уровень);
- Опыт работы с PySpark не менее 1-го года;
- Понимание принципов работы Hadoop-стека;
- Опыт работы с системами хранения данных не менее 1 года;
- Опыт работы с Airflow не менее 1 года;
- Опыт работы с форматами - паркет, xml, json, yaml.
- работа в крупной аккредитованной ИТ компании, занимающей лидирующие позиции на рынке разработки ПО в России;
- развивающая эко-среду проектного офиса в кругу единомышленников и близких по духу сотрудников;
- возможность участвовать в перспективных социально значимых проектах федерального масштаба;
- ранжированные программы ДМС с полным пакетом медицинских услуг;
- программы продвинутого обучения - менторинг и наставничество;
- услуги штатного психолога, терапевта и массажиста;
- система грейдов и бенефитов;
- программы внутреннего и внешнего профессионального обучения и сертификации;
- разнообразные корпоративные активности (тимбилдинги, витаминные дни, детские мероприятия, регулярные турниры по киберспорту, шахматам, настольному теннису, футболу и волейболу);
- широкий перечень корпоративных программ лояльности для сотрудников (изучение английского языка по корпоративным ценам);
- современный комфортабельный офис (бизнес-центр класса В+) в шаговой доступности от ст. метро Парк Победы/Фили.