Старший Data Scientist в команду Deep Personalization (Deep Learning)

Вакансия закрыта. Посмотреть похожие

Локация Москва, Удалённая работа, можно удаленно

В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com

О команде

Мы отвечаем за персонализацию и рекомендации: развиваем двухбашенную трансформерную модель (retrieval) и запускаем трек генеративных рекомендаций (SIDS, OneRec, PLUM и т.п.). Работаем в полном цикле — от данных и обучения до продакшен-инференса и A/B-экспериментов.

Вам предстоит:

— проектировать и поддерживать пайплайны данных на Spark для рекомендаций: витрины, фичи, контроль качества, инкрементальные обновления;

— развивать мультимодальные рекомендации: использовать текст и изображения объявлений, подключать внешние эмбеддинги и улучшать способы их интеграции;

— улучшать контур продакшена: регулярные обновления моделей, экспорт и оптимизация (например, ONNX);

— внедрение моделей не только в рекомендации, но и в поисковые и ассистентские сценарии;

— развивать U2I / retrieval-дообучение на целевые действия и сигналы (например, клики/контакты/покупки);

— развивать и ускорять пайплайны обучения: multi-GPU и multi-node обучение, оптимизация throughput/стабильности, отладка распределённых джобов;

— заниматься ресерчем и прототипированием в генеративных рекомендациях: listwise/session-wise generation, SFT/дообучение, RL-подходы, подготовка к online-экспериментам;

— как senior: брать ответственность за подсистемы и направления, писать дизайн-доки, проводить ревью, менторить и повышать инженерную планку команды.

Мы ждём, что вы:

— уверенно пишете на одном или нескольких языках программирования; у нас в основном Python;

— хорошо владеете PyTorch и имеете продакшен-опыт обучения DL-моделей на больших данных (важен опыт построения пайплайнов, датасетов, метрик, воспроизводимости экспов).

Будет здорово, если вы:

— понимаете, как устроены рекомендации: метрики, классические и DL-подходы, и можете задизайнить базовый двухстадийный стек (candidate generation + ranking);

— работали со Spark/SQL на больших объёмах данных;

— имеете опыт в одном или нескольких направлениях: NLP / CV / RL.

Работа у нас — это:

— возможность влиять на бизнес и развитие продукта;

— интересные и разнообразные задачи: аналитики в Авито ищут точки роста бизнеса, изучают поведение пользователей, придумывают фреймворки и настраивают дашборды;

— много качественных данных, мощная инфраструктура и инструменты, любое необходимое железо — всё готово для продуктивной работы;

— талантливая команда, крутая аналитическая культура и сообщество профессионалов;

— прозрачная система премий, достойная зарплата — размер обсудим на собеседовании;

— личный бюджет на обучение, который можно тратить на книги, курсы и конференции;

— забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;

— удалёнка и замечательный офис в двух минутах от метро «Белорусская»: панорамный вид на центр города, места для уединённой работы и зоны отдыха.

Про направление Подготовка к интервью