Комм Клауд

Старший инженер мониторинга и надежности (Senior Monitoring & Reliability Engineer)

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет
Обязанности:
  • От 3х лет опыта работы с системами мониторинга: Prometheus, Grafana, Zabbix;
  • Настройка алертинга и dashboards (Grafana, Zabbix etc);
  • Сбор, обработка и анализ логов с использованием Opensearch;
  • Понимание метрик, логов и трейсов;
  • Расчет и контроль SLA/SLO/SLI;
  • Опыт работы с инцидентами (Incident Management) и постмортемами;
  • Обеспечение отказоустойчивости систем мониторинга;
  • Опыт построения с нуля мониторинга высоконагруженных систем.
Требования:
  • Высшее образование в области информационных технологий, компьютерных наук или смежных областях;
  • Не менее 5 лет опыта в области SRE, DevOps или системного администрирования;
  • Глубокое понимание принципов надежности, мониторинга и управления инцидентами;
  • Опыт работы с инструментами мониторинга (Prometheus, Grafana, Zabbix и др.), а также с системами обработки и анализа логов (Opensearch).

Будет плюсом:

  • Опыт работы или понимание AIOps;
  • Понимание сетевых технологий (TCP/IP, HTTP, gRPC);
  • Опыт в performance tuning monitoring tools (анализ и оптимизация производительности);
  • Опыт работы в компания- системных интеграторах.
Условия:
  • Мы являемся аккредитованной в Минцифре ИТ-компанией, предоставляющей право на льготную ипотеку и право подачи документов на отсрочку от мобилизации для профильных ИТ специалистов;
  • Удаленный формат работы;
  • Официальное трудоустройство по ТК РФ;
  • Возможность участия в развитии современного продукта на рынке с использованием современного стека технологий;
  • Мягкую процедуру адаптации и обучения.