DS-инженер в команду Item2param
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
В Авито появляется всё больше новых категорий, каждая из которых продвигается по уровням зрелости, приближается к market normal и запускает новые продукты. Развитие категорий невозможно без качественного покрытия контента параметрами. Поэтому мы в команде Item2param разрабатываем платформу для обучения и инференса ML-моделей, которые извлекают признаки объявлений. Уже сейчас на базе платформы любой Data Scientist компании может обучить и выкатить в продакшен свою модель. Результаты работы моделей используют десятки команд Авито: для модерации категории объявления, автозаполнения параметров на подаче, определения типа ремонта по фото в недвижимости и многого другого. С одной стороны мы используем самые последние модели, чтобы добиваться лучшего качества, с другой — оптимизируем инференс, чтобы держать реал-тайм нагрузку.
Поскольку число запросов на модели растёт, перед нами стоит цель снизить порог входа на платформу: сделать так, чтобы свою модель мог добавить любой сотрудник без навыков ML — только за счёт разметки датасета, используя готовые инструменты.
Вам предстоит:
— повышать качество текущих базовых моделей: текстовых, картиночных и мультимодальных трансформеров;
— автоматизировать обучение: настройка пайплайнов для сбора данных, переобучения и мониторинга качества;
— дорабатывать пайплайны разметки с использованием LLM;
— масштабировать и оптимизировать сервис под растущую нагрузку (тысячи запросов в секунду) и под новые модели;
— добавлять новые сценарии: например, возможности определения параметров со свободным полем ввода (задача ner).
Мы ждём, что вы:
— имеете не мене четырёх лет опыта реализации и эксплуатации ML-решений, в том числе опыт в задачах DL для текстов и/или картинок (не менее двух лет);
— умеете размечать данные для своих задач;
— работали с микросервисами на Python, Docker’ом, SQL- и noSQL-базами.
Будет здорово, если вы:
— имеете опыт менторства младших коллег;
— работали с мультимодальными моделями;
— разбираетесь в Airflow и MLflow или в аналогичных MLOps-инструментах.
Работа у нас — это:
— возможность улучшать опыт миллионов пользователей;
— интересные и сложные задачи на большом масштабе;
— сильная команда, которая всегда готова прийти на помощь;
— возможность изучать и пробовать новое, мощное железо для этого;
— бюджет на обучение, который можно тратить на курсы или профессиональную литературу;
— забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;
— возможность работать удалённо или из офисов в четырёх городах России.