Старший Data Scientist в команду репутационной системы
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
Наша команда разрабатывает и поддерживает пайплайны и модели скоринга коммуникаций для борьбы со спамом, фродом и прочими нарушениями, влияющими на опыт покупателей и продавцов на площадке.
Сейчас мы ищем опытного DS-инженера, готового разрабатывать end-to-end решения: от анализа данных и обучения моделей до инференса и мониторинга в нагруженных продакшен-системах.
Примеры будущих задач:
- проектировать, обучать и внедрять NLP-модели для детекции подозрительных и нежелательных интентов и паттернов в коммуникациях, начиная от уводов в другие каналы связи и заканчивая намеренными обфускациями текста в обход проверок Авито;
- экспериментировать с SOTA-методами машинного обучения в тех случаях, когда применение таких методов оправдано решаемой задачей;
- настраивать сбор разметки и контролировать её качество (как с помощью асессоров, так и при использовании LLM-решений);
- встраивать модели в сервисы для скоринга и выкатывать в продакшен, следить за стабильностью работы пайплайнов и моделей;
- проводить AB-тесты, оценивать влияние решений на продукт и бизнес-метрики.
Мы ждём, что вы:
- имеете большой опыт в построении NLP-моделей;
- уверенно владеете Python и DS-стеком и работаете с DL-фреймворками (например, PyTorch);
- пишете SQL-запросы для сбора данных и диагностики качества моделей;
- умеете проводить полный цикл ML-разработки: данные → модель → прод → мониторинг → проверка влияния (AB или эквивалентные подходы);
- понимаете принципы продовой эксплуатации моделей в real-time и near-real-time контурах;
- оперируете не только ML-метриками, но и оцениваете влияние разработанного решения на бизнес-метрики, за которые отвечает команда.
Будет здорово, если вы:
- знакомы с практиками MLOps: Kubeflow, K8s, feature store, MLflow;
- использовали LLM в прикладных задачах;
- владеете английским языком на уровне, позволяющем читать специализированную литературу.
Работа у нас — это:
- возможность реализовать свои идеи в проекте с многомиллионной аудиторией;
- мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы;
- прозрачная система премий, достойная зарплата — размер обсудим на собеседовании;
- личный бюджет на обучение, который можно тратить на книги, курсы и конференции;
- забота о здоровье: у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;
- удалёнка и замечательный офис в двух минутах от метро «Белорусская»: панорамный вид на центр города, места для уединённой работы и зоны отдыха.