
Комм Клауд
Старший инженер мониторинга и надежности (Senior Monitoring & Reliability Engineer)
Не указана
Обязанности:
- От 3х лет опыта работы с системами мониторинга: Prometheus, Grafana, Zabbix;
- Настройка алертинга и dashboards (Grafana, Zabbix etc);
- Сбор, обработка и анализ логов с использованием Opensearch;
- Понимание метрик, логов и трейсов;
- Расчет и контроль SLA/SLO/SLI;
- Опыт работы с инцидентами (Incident Management) и постмортемами;
- Обеспечение отказоустойчивости систем мониторинга;
- Опыт построения с нуля мониторинга высоконагруженных систем.
- Высшее образование в области информационных технологий, компьютерных наук или смежных областях;
- Не менее 5 лет опыта в области SRE, DevOps или системного администрирования;
- Глубокое понимание принципов надежности, мониторинга и управления инцидентами;
- Опыт работы с инструментами мониторинга (Prometheus, Grafana, Zabbix и др.), а также с системами обработки и анализа логов (Opensearch).
Будет плюсом:
- Опыт работы или понимание AIOps;
- Понимание сетевых технологий (TCP/IP, HTTP, gRPC);
- Опыт в performance tuning monitoring tools (анализ и оптимизация производительности);
- Опыт работы в компания- системных интеграторах.
- Мы являемся аккредитованной в Минцифре ИТ-компанией, предоставляющей право на льготную ипотеку и право подачи документов на отсрочку от мобилизации для профильных ИТ специалистов;
- Удаленный формат работы;
- Официальное трудоустройство по ТК РФ;
- Возможность участия в развитии современного продукта на рынке с использованием современного стека технологий;
- Мягкую процедуру адаптации и обучения.