Бэкенд-разработчик в команду ML Platform

В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com

О команде

Команда Avito ML Platform проектирует, разрабатывает и автоматизирует задачи, с которыми сталкиваются аналитики и data science  специалисты ежедневно, сокращая время от гипотезы до продакшена. Все решения нацелены на выполнение в облачной среде с максимальной утилизацией ресурсов. Число пользователей платформы растет и нужно больше погружаемся в детали ML процессов, стабилизацию и оптимизацию сервисов доставки моделей, разрабатывать новые решения и многое другое.

Примеры будущих задач:

  • проектировать, разрабатывать и поддерживать cloud-native решения для задач data science;
  • оптимизация производительности инфраструктуры обеспечивая высокую доступность, масштабируемость и эффективное использование ресурсов;
  • взаимодействие с data science командами, чтобы понять, что нужно улучшить;
  • изучение современных технологий, подходов и процессов, чтобы лучшее применять в проекте.

Вам предстоит:

  • разработка и поддержка ML-сервисов;
  • мониторинг производительности и оперативная отладка;
  • участие в планировании и приоритизации задач;
  • исследование и внедрение новых ML-инструментов.

Мы ждём, что вы:

  • работаете больше 3х лет с AI/ML инфраструктурой;
  • имеете опыт разработки приложений сервисов на Go/Python;
  • имеете опыт с технологиями контейнеризации: Docker;
  • работали с оркестраторами такими как: Kubernetes, slurm;
  • работали с распределенными хранилищами: Сeph, BeeGFS;
  • работали с операторами для Kubernetes и разрабатывали свои;
  • имеете опыт с системами развертывания приложений в k8s (helm, kustomize, argocd);
  • работали с системами мониторинга/алертинга (prometheus, victoria metrics);
  • хорошо разбираетесь в сетевом стеке;
  • разрабатывали и поддерживали отказоустойчивые системы.

Будет здорово, если вы:

  • работали как пользователь HPC кластера;
  • имеете опыт тюнинга Ethernet, RoCE, Infiniband;
  • имеете опыт запуска и оптимизации распределенного обучения используя PyTorch или другие фреймворки;
  • знакомы с DAG оркестраторами: airflow, argoworkflow;
  • занимались построением multi-tenancy решений;
  • имеете опыт выстраивания процессов доставки моделей до продакшена и мониторинг.

Работа у нас — это:

  • интересные и важные задачи в большом проекте;
  • опытные и заинтересованные коллеги, готовые оказать поддержку;
  • комфортные условия работы: ДМС, фитнес, компенсация питания и прекрасный вид на центр Москвы;
  • красивый и комфортный опенспейс с видом на центр города: два десятка переговорок, зоны отдыха, гамаки и скейтборды;
  • обучение за счёт компании: мы оплачиваем профильные курсы, участие в российских и международных конференциях, во внутренних митапах, хакатонах, тренингах и доступ к онлайн-библиотеке издательства «МИФ»;
  • развитие софт скиллов: на курсах для сотрудников можно прокачать своё мастерство коммуникаций или выучить английский;
  • гибкое начало рабочего дня по согласованию с руководителем;
  • заботу о здоровье: с первого дня работы вы получите страховку со стоматологией, в офисе ведут приём терапевт, психолог и массажист;
  • достойную зарплату, бонусы и премии — размер обсудим на собеседовании.
Поделиться
Скопировать ссылку Вконтакте Telegram WhatsApp