РобоФинанс

Руководитель отдела мониторинга

Не указана
  • Москва
  • Полная занятость
  • Удаленная работа
  • От 3 до 6 лет

Задачи, которые будут в твоих руках:

  • Руководство группой круглосуточного мониторинга (8 FTE) прикладного ПО и инфраструктуры.

  • Автоматизация и роботизация деятельности подразделения, приём типовых кейсов на поддержку от подразделений сопровождения (администраторов) 2L.

  • Выполнение обязанностей инцидент-менеджера: оперативное информирование руководства о сбоях и процессе их устранения, организация аварийных конференций и работ по решению критических инцидентов.

  • Подготовка аналитической отчётности по массовым инцидентам, ведение встреч еженедельного инцидент-контроля.

  • Взаимодействие с подразделениями эксплуатации и развития IT, с ключевыми бизнес-заказчиками по вопросам, касающимся решения массовых критических инцидентов / аварий и устранения их последствий.

  • Покрытие алертами всего, что может по какой то причине сломаться.


Что для этого нужно:

  • Опыт работы в IT от 3 лет. Из них не менее 2х - в службах сопровождения прикладного ПО и бизнес-процессов (предпочтительно - в финтех-секторе (банки, МФО, вендоры ППО, системные интеграторы и т.п.).

  • Практический опыт организации и руководства подразделениями круглосуточного мониторинга ППО и инфраструктуры.

  • Опыт работы с Grafana, Prometeus, Zabbix, ELK.

  • Навыки создания алертов используя PromQL, Git и Alertmanager.

  • Навыки постановки новых информационных систем (КЕ) на мониторинг, подготовки и согласования с заказчиками требований к мониторингу ИС.

  • Опыт работы с основными современными операционными системами в объёме прикладного администратора Win / *nix (знание команд, обязательно навыки работы в консоли OS).

  • Знание SQL на уровне, достаточном для написания запросов по извлечению данных из БД сервисных систем IT.

  • Общее понимание основных компонент ППО и инфраструктуры, их назначения и принципов взаимодействия в современном IT-ландшафте крупных компаний.

  • Уверенные знания ITIL (v3 / v4): все основные сущности и производственные процессы IT.

  • Опыт работы в одной из промышленных трекинг-систем (Atlassian Jira & Confluence / HP ServiceManager / Redmine и т.п.).

  • Знакомство с платформами роботизации и Low-code-программирования, желателен опыт внедрения и практического использования одной из систем данного класса.

  • Навыки документирования деятельности, написания инструкций.

  • Опыт подбора и обучения персонала, наставничества.