DS инженер в команду Search Recall
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
Команда отвечает за получение объявлений на L1-стадии поиска — то есть за формирование первичного пула кандидатов для поисковой выдачи. Мы разрабатываем и совершенствуем системы, которые эффективно отбирают релевантные товары среди десятков миллионов позиций. В работе сочетаем как простые эвристики, так и deep learning модели. Команда тесно сотрудничает с другими подразделениями поиска, чтобы обеспечивать высокое качество, скорость и масштабируемость. Наша задача — сделать результаты поиска максимально точными и полезными для пользователя с первых миллисекунд.
Примеры будущих задач:
- улучшение качества векторного поиска и эксперименты с новыми архитектурами эмбеддингов;
- разработка LLM-моделей для суммаризации объявлений и обогащения данных;
- cоздание новых кандидатогенераторов с учётом специфики отдельных категорий и пользовательских сценариев;
- оптимизация и развитие существующих кандгенов для повышения точности и покрытия поиска;
- участие в проектировании и разработке внутренней платформы для ускоренного создания и тестирования кандгенов.
Вам предстоит:
- готовить данные, проводить аналитику и формировать гипотезы для улучшения качества поиска;
- разрабатывать MLP-модели — от быстрых прототипов до продакшен-готовых решений;
- работать с backend-сервисами на Python и Go, участвовать в проектировании и разработке новых компонентов;
- проявлять продуктовое мышление и оценивать влияние изменений на ключевые метрики и пользовательский опыт;
- запускать A/B-тесты, контролировать корректность экспериментов и анализировать результаты.
Мы ждём, что вы:
- имеете большой опыт в разработке на Python, понимаете основы параллельного программирования;
- обладаете уверенными навыками работы с PyTorch и успешным опытом в создании нетиповых пайплайнов обучения;
- знаете основные DL-архитектуры в своём домене, понимаете архитектуру трансформера.
Будет здорово, если вы:
- пишете на Go или любом другом строго типизированном языке;
- имеете опыт в распределённом обучении;
- имеете опыт в поисковых и рекомендательных системах;
- имеете опыт внедрения DL-моделей в продакшен и оптимизации инференса.
Работа у нас — это:
- возможность улучшать опыт миллионов пользователей;
- интересные и сложные задачи на большом масштабе;
- сильная команда, которая всегда готова прийти на помощь;
- возможность изучать и пробовать новое, мощное железо для этого;
- бюджет на обучение, который можно тратить на курсы или профессиональную литературу;
- забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;
- возможность работать удалённо или из офисов в четырёх городах России.