Бэкенд-разработчик в команду ML Platform
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
Команда Avito ML Platform проектирует, разрабатывает и автоматизирует задачи, с которыми сталкиваются аналитики и data science специалисты ежедневно, сокращая время от гипотезы до продакшена. Все решения нацелены на выполнение в облачной среде с максимальной утилизацией ресурсов. Число пользователей платформы растет и нужно больше погружаемся в детали ML процессов, стабилизацию и оптимизацию сервисов доставки моделей, разрабатывать новые решения и многое другое.
Примеры будущих задач:
- проектировать, разрабатывать и поддерживать cloud-native решения для задач data science;
- оптимизация производительности инфраструктуры обеспечивая высокую доступность, масштабируемость и эффективное использование ресурсов;
- взаимодействие с data science командами, чтобы понять, что нужно улучшить;
- изучение современных технологий, подходов и процессов, чтобы лучшее применять в проекте.
Вам предстоит:
- разработка и поддержка ML-сервисов;
- мониторинг производительности и оперативная отладка;
- участие в планировании и приоритизации задач;
- исследование и внедрение новых ML-инструментов.
Мы ждём, что вы:
- работаете больше 3х лет с AI/ML инфраструктурой;
- имеете опыт разработки приложений сервисов на Go/Python;
- имеете опыт с технологиями контейнеризации: Docker;
- работали с оркестраторами такими как: Kubernetes, slurm;
- работали с распределенными хранилищами: Сeph, BeeGFS;
- работали с операторами для Kubernetes и разрабатывали свои;
- имеете опыт с системами развертывания приложений в k8s (helm, kustomize, argocd);
- работали с системами мониторинга/алертинга (prometheus, victoria metrics);
- хорошо разбираетесь в сетевом стеке;
- разрабатывали и поддерживали отказоустойчивые системы.
Будет здорово, если вы:
- работали как пользователь HPC кластера;
- имеете опыт тюнинга Ethernet, RoCE, Infiniband;
- имеете опыт запуска и оптимизации распределенного обучения используя PyTorch или другие фреймворки;
- знакомы с DAG оркестраторами: airflow, argoworkflow;
- занимались построением multi-tenancy решений;
- имеете опыт выстраивания процессов доставки моделей до продакшена и мониторинг.
Работа у нас — это:
- интересные и важные задачи в большом проекте;
- опытные и заинтересованные коллеги, готовые оказать поддержку;
- комфортные условия работы: ДМС, фитнес, компенсация питания и прекрасный вид на центр Москвы;
- красивый и комфортный опенспейс с видом на центр города: два десятка переговорок, зоны отдыха, гамаки и скейтборды;
- обучение за счёт компании: мы оплачиваем профильные курсы, участие в российских и международных конференциях, во внутренних митапах, хакатонах, тренингах и доступ к онлайн-библиотеке издательства «МИФ»;
- развитие софт скиллов: на курсах для сотрудников можно прокачать своё мастерство коммуникаций или выучить английский;
- гибкое начало рабочего дня по согласованию с руководителем;
- заботу о здоровье: с первого дня работы вы получите страховку со стоматологией, в офисе ведут приём терапевт, психолог и массажист;
- достойную зарплату, бонусы и премии — размер обсудим на собеседовании.