SRE в команду ML-платформы
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
Команда ML-платформы Avito занимается проектированием, разработкой и автоматизацией задач, с которыми ежедневно сталкиваются аналитики и специалисты по data science, стремясь сократить время от возникновения гипотезы до её реализации. Все решения команды ориентированы на работу в облачной среде с максимальной утилизацией ресурсов. В связи с ростом числа пользователей платформы, команда углубляется в детали ML-процессов, занимается стабилизацией и оптимизацией сервисов доставки моделей, а также разрабатывает новые решения.
Вам предстоит:
- проектировать, разрабатывать и поддерживать cloud-native решения для задач data science;
- оптимизировать производительность инфраструктуры, обеспечивая высокую доступность, масштабируемость и эффективное использование ресурсов;
- взаимодействовать с data science командами, чтобы понять, что нужно улучшить;
- изучать современные технологии, подходы и процессы, чтобы лучшее применять в проекте.
Мы ждём, что вы:
- работаете больше 3х лет с AI/ML инфраструктурой;
- имеете опыт работы с технологиями контейнеризации (Docker), оркестраторами (Kubernetes), распределенными хранилищами, системами развертывания приложений в k8s, системами мониторинга/алертинга;
- понимаете работу сетового стека;
- пишете и читаете код на Go, Python, Bash;
- разрабатывали и поддерживали отказоустойчивые системы;
Будет здорово, если вы:
- работали как пользователь HPC кластера;
- имеете опыт тюнинга Ethernet, RoCE, Infiniband;
- умеете запускать и оптимизировать распределенное обучение, используя PyTorch или другие фреймворки;
- понимаете работу DAG оркестраторов: airflow, argoworkflow;
- строили multi-tenancy решения;
- имете опыт выстраивания процессов доставки моделей до продакшена.
Работа у нас — это:
- возможность реализовать свои идеи в проекте с многомиллионной аудиторией;
- талантливая команда, готовая поддержать ваши инициативы;
- мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы;
- прозрачная система премий, достойная зарплата — размер обсудим на собеседовании;
- личный бюджет на обучение, который можно тратить на книги, курсы и конференции;
- забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;
- замечательный офис в двух минутах от метро «Белорусская»: панорамный вид на центр города, места для уединённой работы и зоны отдыха. Возможность работать удаленно.