Альфа-Банк

SRE-инженер

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет

Чем предстоит заниматься:

Разрабатывать средства мониторинга и инцидент-менеджмента для продукта

  • Определяет и внедряет SLO/SLA/SLI для сервисов продукта
  • Реагирует на инциденты, проводит постмортемы и анализирует причины сбоев (root cause analysis)
  • Разрабатывает и контролирует метрики надежности, отказоустойчивости и доступности продукта
  • Разрабатывает средства мониторинга и аллертинга (VictoriaMetrics, Prometheus, Grafana)

Оптимизировать производительность и доступность продукта

  • Анализирует и оптимизирует нагрузку, снижает latencies сервисов
  • Настраивает горизонтальное и вертикальное масштабирование сервисов
  • Обеспечивает отказоустойчивость через репликацию, балансировку нагрузки, улучшение архитектуры продукта

Взаимодействовать с разработчиками и внедрять DevOps/SRE-практики

  • Помощь в настройке логирования и трассировки (ELK, Loki, OpenTelemetry)
  • Улучшение процессов разработки через внедрение best practices SRE
  • Обучение разработчиков работе с инфраструктурой и инструментами SRE

Оптимизировать процесс развертывания приложений

  • Внедряет новые стратегии развёртывания программного обеспечения (Blue/Green deployemnt, Canary deployment)
  • Оптимизирует CI/CD процессы, устраняет toil-задачы
  • Оптимизирует использование ресурсов и on-prem решений

Чего мы ждем от тебя:

  • Опыт разработки java
  • Глубокое понимание принципов SRE и системного сопровождения: SLA/SLO/SLI, инцидент-менеджмент, проблем-менеджмент, root cause analysis, postmortem-процессы, устранение toil.
  • Опыт стабилизации и оптимизации микросервисных систем, развернутых в Kubernetes, а также опыт с инструментами сервис-мешами (например, Istio) для микросервисной архитектуры.
  • Уверенное владение инструментами мониторинга и логирования: Prometheus, Grafana, ELK, Loki, OpenTelemetry, Zabbix, APM-системами и пр.
  • Опыт работы, устранения связанных аварий и оптимизации использования PostgreSQL, MongoDB, ElasticSearch, Kafka, Redis

Что мы предлагаем:

  • Стабильный и прозрачный доход: размер заработной платы обсуждается по итогам собеседования + квартальная премия по результатам KPI
  • Гибкий график работы: вы сможете планировать время так, как удобно вам и вашей команде
  • Полную удалёнку или гибрид на выбор, а также уютный ИТ-хаб в Москве, Санкт-Петербурге, Екатеринбурге и сезонный коворкинг в Сочи
  • Сложные и интересные задачи, современный стек технологий
  • Заботу о вашем здоровье: программа ДМС с первых дней работы, куда входит стоматология, обслуживание в лучших клиниках города, страхование и компенсация 10-ти дней больничного
  • Возможность вертикального и горизонтального карьерного роста: регулярно проходят тренинги, вебинары, митапы и демо-дни
  • Оплату посещения профильных конференций и курсов, помогаем с подготовкой к публичным выступлениям и написанием статей на Хабр
  • Доступ к бесплатным корпоративным библиотекам Alpina Digital, MyBook и бизнес-изданий
  • Предложения от Банка только для сотрудников: собственные спортзалы (Москва, Санкт-Петербург, Екатеринбург), а также скидки на услуги туристических агентств, продукты питания, в рестораны, бары, магазины