Менеджер по управлению проблемами в команду Инцидент и проблем менеджмента

В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com

О команде

Стабильность Avito зависит от слаженной работы тысячи сервисов, которые обновляются много раз в день. Иногда случаются инциденты, которые приводят к ухудшению опыта пользователя. Чтобы инциденты случались еще реже, нужно найти корневую проблему и координируя действия команд, убрать ее до возможного повторения.
Людей, которые могут обрабатывать проблемы мы называем менеджер по управлению проблемами.

Примеры будущих задач:

Основная задача менеджера по управлению проблемами - определить причины проблем ( и связанных с ней нескольких или одного инцидента) и скоординировать разные команды, чтобы их устранить, проконтролировать устранение, и убедиться, что проблема действительно решена.

Вам предстоит:

  • после того как инцидент или инциденты удалось успешно закрыть, нужно:

    • обогатить релевантными данными, сделать анализ последствий инцидентов, сформулировать проблему, и оценить объем урона;
    • категоризировать источник проблемы - это единичная проблема или повтор;
    • собрать участников и провести разбор проблемы, дополнить анализ мнениями, определить шаги для устранения проблемы;
    • оформить post-mortem по результатам разбора;
    • проконтролировать, что причины проблемы будут устранены и инцидентов стало меньше;
  • предлагать способы улучшения процесса работы над проблемами.

Мы ждём, что вы:

  • имеете релевантный рабочий опыт по анализу комплексных технических проблем - системный администратор, аналитик, Devops, SRE;
  • анализировали проблемы и писали post-mortem'ы по инцидентам и проблемам (согласно модели ITIL);
  • имеете большой технический кругозор, представление как строятся современные IT решения (back-end, mobile, web);
  • умеете работать с monitoring системами (например, Grafana) для поиска связанных с инцидентом аномалий;
  • работали с распределенными много-компонентными системами будем плюсом (сервисов в компании больше тысячи, найти источник проблемы непросто).

Работа у нас — это:

  • возможность реализовать свои идеи в проекте с многомиллионной аудиторией;
  • возможность увидеть, потрогать, пощупать весь технологический стек (тысячи серверов и микросервисов) Авито с первого дня работы
  • работа в гибридном формате, основная часть команды в Москве, но готовы обсудить полностью удаленный формат из любой точки мира;
  • комфортные условия работы: ДМС, фитнес, компенсация питания;
  • возможность проходить обучение за счет компании, участие во внутренних митапах, хакатонах, тренингах.