Data Scientist в команду Deep Personalization (Deep Learning)

Команда Поиск и рекомендации

Локация Москва, гибрид

В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com

О команде

Мы отвечаем за персонализацию и рекомендации: развиваем двухбашенную трансформерную модель (retrieval) и запускаем трек генеративных рекомендаций (SIDS, OneRec, PLUM и т.п.). Работаем в полном цикле — от данных и обучения до продакшен-инференса и A/B-экспериментов.

Вам предстоит:

проектировать и поддерживать пайплайны данных на Spark для рекомендаций: витрины, фичи, контроль качества, инкрементальные обновления;

развивать мультимодальные рекомендации: использовать текст и изображения объявлений, подключать внешние эмбеддинги и улучшать способы их интеграции;

улучшать контур продакшена: регулярные обновления моделей, экспорт и оптимизация (например, ONNX);

внедрять моделей не только в рекомендации, но и в поисковые и ассистентские сценарии;

развивать U2I / retrieval-дообучение на целевые действия и сигналы (например, клики/контакты/покупки);

развивать и ускорять пайплайны обучения: multi-GPU и multi-node обучение, оптимизация throughput/стабильности, отладка распределённых джобов;

заниматься ресерчем и прототипированием в генеративных рекомендациях: listwise/session-wise generation, SFT/дообучение, RL-подходы, подготовка к online-экспериментам.

Мы ждём, что вы:

уверенно пишете на одном или нескольких языках программирования; у нас в основном Python;

хорошо владеете PyTorch и имеете продакшен-опыт обучения DL-моделей на больших данных (важен опыт построения пайплайнов, датасетов, метрик, воспроизводимости экспов).

Будет здорово, если вы:

понимаете, как устроены рекомендации: метрики, классические и DL-подходы, и можете задизайнить базовый двухстадийный стек (candidate generation + ranking);

работали со Spark/SQL на больших объёмах данных;

имеете опыт в одном или нескольких направлениях: NLP / CV / RL.

Работа у нас — это:

возможность улучшать опыт миллионов пользователей;

интересные и сложные задачи на большом масштабе;

сильная команда, которая всегда готова прийти на помощь;

возможность изучать и пробовать новое, мощное железо для этого;

бюджет на обучение, который можно тратить на курсы или профессиональную литературу;

забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;

возможность работать удалённо или из офисов в четырёх городах России.

Всего в Авито открыто 154 вакансии

Смотреть вакансии Вакансии в Telegram

Офис в Москве ул. Лесная, 7 ул. Лесная, 7

Офис в Петербурге Малоохтинский пр-кт, 64, лит B Малоохтинский пр-кт, 64, лит B

Офис в Казани ул. Московская, зд. 19/8 ул. Московская, зд. 19/8

Офис в Самаре ул. Ново-Садовая, д. 160Д стр 2 ул. Ново-Садовая, д. 160Д стр 2

Согласно данным Similar Web, Авито — самая посещаемая онлайн-платформа объявлений в мире. Сегодня с помощью Авито можно разместить объявления в категориях: Товары, Авто, Работа, Услуги, Недвижимость. Для удобного и безопасного заключения сделок в сервис интегрирована Авито Доставка с десятками тысяч доступных пунктов выдачи, которая позволяет пользователям осуществлять сделки практически по всей России — от Калининграда до Владивостока. Каждая пятая сделка на Авито совершается с Доставкой. Авито объединяет продавцов и покупателей, как со стороны частных лиц, так и представителей малого и среднего бизнеса, а также корпораций.

Количество активных объявлений на Авито сегодня — более 230 млн, ежемесячная аудитория — более 72 млн пользователей. Каждую секунду на Авито совершается более 10 сделок, ежедневно пользователи добавляют более 2 млн новых объявлений. В Авито работает более 10 000 сотрудников.

Разработано