Менеджер по управлению проблемами в команду Инцидент и проблем менеджмента
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
Стабильность Avito зависит от слаженной работы тысячи сервисов, которые обновляются много раз в день. Иногда случаются инциденты, которые приводят к ухудшению опыта пользователя. Чтобы инциденты случались еще реже, нужно найти корневую проблему и координируя действия команд, убрать ее до возможного повторения.
Людей, которые могут обрабатывать проблемы мы называем менеджер по управлению проблемами.
Примеры будущих задач:
Основная задача менеджера по управлению проблемами - определить причины проблем ( и связанных с ней нескольких или одного инцидента) и скоординировать разные команды, чтобы их устранить, проконтролировать устранение, и убедиться, что проблема действительно решена.
Вам предстоит:
после того как инцидент или инциденты удалось успешно закрыть, нужно:
- обогатить релевантными данными, сделать анализ последствий инцидентов, сформулировать проблему, и оценить объем урона;
- категоризировать источник проблемы - это единичная проблема или повтор;
- собрать участников и провести разбор проблемы, дополнить анализ мнениями, определить шаги для устранения проблемы;
- оформить post-mortem по результатам разбора;
- проконтролировать, что причины проблемы будут устранены и инцидентов стало меньше;
- предлагать способы улучшения процесса работы над проблемами.
Мы ждём, что вы:
- имеете релевантный рабочий опыт по анализу комплексных технических проблем - системный администратор, аналитик, Devops, SRE;
- анализировали проблемы и писали post-mortem'ы по инцидентам и проблемам (согласно модели ITIL);
- имеете большой технический кругозор, представление как строятся современные IT решения (back-end, mobile, web);
- умеете работать с monitoring системами (например, Grafana) для поиска связанных с инцидентом аномалий;
- работали с распределенными много-компонентными системами будем плюсом (сервисов в компании больше тысячи, найти источник проблемы непросто).
Работа у нас — это:
- возможность реализовать свои идеи в проекте с многомиллионной аудиторией;
- возможность увидеть, потрогать, пощупать весь технологический стек (тысячи серверов и микросервисов) Авито с первого дня работы
- работа в гибридном формате, основная часть команды в Москве, но готовы обсудить полностью удаленный формат из любой точки мира;
- комфортные условия работы: ДМС, фитнес, компенсация питания;
- возможность проходить обучение за счет компании, участие во внутренних митапах, хакатонах, тренингах.