SRE в команду Analytics Infrastructure

Команда Аналитическая платформа

Кластер Analytics Platform

Локация Москва, удалёнка или гибрид

В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com

Откликнуться

О команде

Мы — команда хранилища данных Авито. У нас есть более сотни внутренних и внешних систем, из которых мы получаем данные. Мы строим отчётность, помогаем бизнесу проверять гипотезы и принимать решения, а также выбирать эффективные способы достижения целей на основе данных.

Наша цель — сделать так, чтобы хранилище работало стабильно и соответствовало требованиям по доступности, отказоустойчивости и своевременной готовности данных, которые важны для наших пользователей.

Мы адаптируем инфраструктуру аналитической платформы для быстрого развёртывания и отказоустойчивой работы. Переходим на более гибкое решение и хотим применять подходы распределённой архитектуры к хранилищу данных. Поддержка такой системы становится сложнее, поэтому нам предстоит перейти от подхода «все проблемы исправляются ручным перезапуском» к подходу, при котором система восстанавливает себя сама без ручного вмешательства.

Среди наших задач — обеспечить эффективную утилизацию ресурсов хранилища, упростить поддержку и масштабирование узлов, сделать компоненты отказоустойчивыми, повысить наблюдаемость инфраструктуры, разработать прозрачный механизм ответственности за готовность данных в срок и сократить число инцидентов.

Какие задачи вас ждут:

— поддерживать выделенные кластеры Kubernetes аналитической платформы для отказоустойчивой работы Flink и Trino;

— обеспечивать оптимальную конфигурацию кластера на всех этапах;

— заниматься мониторингом и тонкой настройкой составных частей кластера: RocksDB, HAProxy и т. д.;

— автоматизировать рутинные процессы;

— тестировать и внедрять новые версии фреймворка;

— участвовать в расследовании инцидентов и устранять проблемы производительности;

— оптимизировать использование ресурсов и повышать эффективность работы сервисов.

Мы ждем, что вы:

— проектировали компоненты распределённых систем или отвечали за них;

— любите разбираться в том, как работают аналитические системы;

— имеете опыт работы в роли SRE, DevOps-, Infrastructure- или бэкенд-инженера от 3 лет;

— уверенно работаете с Linux и умеете заниматься траблшутингом продовых систем;

— умеете программировать на Python, Java или другом языке программирования.

Работа у нас — это:

— возможность реализовать свои идеи в проекте с многомиллионной аудиторией;

— талантливая команда, готовая поддержать ваши инициативы;

— мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы;

— прозрачная система премий, достойная зарплата— размер обсудим на собеседовании;

— личный бюджет на обучение, который можно тратить на книги, курсы и конференции;

— забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;

— удалёнка и офис в 2 минутах от метро «Белорусская»: панорамный вид на центр города, места для уединённой работы и зоны отдыха.

Про кластер Про команду Подготовка к интервью

SRE в команду Analytics Infrastructure

О команде

Какие задачи вас ждут:

Мы ждем, что вы:

Работа у нас — это:

Откликнитесь на вакансию

Похожие вакансии