Старший Data Scientist в команду репутационной системы

Вакансия закрыта. Посмотреть похожие

Локация Москва Нижний Новгород

В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com

О команде

Наша команда разрабатывает и поддерживает пайплайны и модели скоринга коммуникаций для борьбы со спамом, фродом и прочими нарушениями, влияющими на опыт покупателей и продавцов на площадке.

Сейчас мы ищем опытного DS-инженера, готового разрабатывать end-to-end решения: от анализа данных и обучения моделей до инференса и мониторинга в нагруженных продакшен-системах.

Примеры будущих задач:

проектировать, обучать и внедрять NLP-модели для детекции подозрительных и нежелательных интентов и паттернов в коммуникациях, начиная от уводов в другие каналы связи и заканчивая намеренными обфускациями текста в обход проверок Авито;
экспериментировать с SOTA-методами машинного обучения в тех случаях, когда применение таких методов оправдано решаемой задачей;
настраивать сбор разметки и контролировать её качество (как с помощью асессоров, так и при использовании LLM-решений);
встраивать модели в сервисы для скоринга и выкатывать в продакшен, следить за стабильностью работы пайплайнов и моделей;
проводить AB-тесты, оценивать влияние решений на продукт и бизнес-метрики.

Мы ждём, что вы:

имеете большой опыт в построении NLP-моделей;
уверенно владеете Python и DS-стеком и работаете с DL-фреймворками (например, PyTorch);
пишете SQL-запросы для сбора данных и диагностики качества моделей;
умеете проводить полный цикл ML-разработки: данные → модель → прод → мониторинг → проверка влияния (AB или эквивалентные подходы);
понимаете принципы продовой эксплуатации моделей в real-time и near-real-time контурах;
оперируете не только ML-метриками, но и оцениваете влияние разработанного решения на бизнес-метрики, за которые отвечает команда.

Будет здорово, если вы:

знакомы с практиками MLOps: Kubeflow, K8s, feature store, MLflow;
использовали LLM в прикладных задачах;
владеете английским языком на уровне, позволяющем читать специализированную литературу.

Работа у нас — это:

возможность реализовать свои идеи в проекте с многомиллионной аудиторией;
мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы;
прозрачная система премий, достойная зарплата — размер обсудим на собеседовании;
личный бюджет на обучение, который можно тратить на книги, курсы и конференции;
забота о здоровье: у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;
удалёнка и замечательный офис в двух минутах от метро «Белорусская»: панорамный вид на центр города, места для уединённой работы и зоны отдыха.

Про направление Подготовка к интервью