Старший Data Scientist в команду антифрода
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
Наша команда разрабатывает и поддерживает алгоритмы скоринга и проверки пользователей. Наша главная цель — минимизировать действия, которые наносят ущерб пользователям или компании. Мы боремся с массовыми авторегистрациями, арендой и взломами учётных записей, автоматическим сбором данных и другими проявлениями фрода.
Примеры будущих задач:
— разрабатывать и внедрять модели для детекции взломов, аренды аккаунтов, авторегистраций, парсеров;
— улучшать существующие эвристики и модели: от простых правил до ML-систем с онлайн-инференсом;
— анализировать эффективность решений как на исторических данных, так и в продакшене, с учётом бизнес-метрик;
— проводить AB-тесты и выводить модели в прод;
— улучшать алгоритмы поиска фрода в сервисе, который обрабатывает тысячи событий в минуту;
— находить нетривиальные и эффективные решения реальных бизнес-задач;
Вам предстоит:
— улучшать существующие средства обнаружения фрода, адаптируя их к постоянно меняющейся внешней среде (на основе данных и фидбэка от потребителей данных решений — как асессоров, так и нарушителей наших правил);
— экспериментировать с SOTA-методами машинного обучения в тех случаях, когда применение таких методов оправдано решаемой задачей;
— проектировать и внедрять end-to-end ML-решения;
— отслеживать деградации, следить за метриками в проде и участвовать в непрерывном улучшении моделей после запуска.
Мы ждём, что вы:
— имеете высшее образование в области прикладной математики, статистики, ML или в смежных областях;
— обладаете глубоким пониманием ключевых методов, применяемых при решении задач машинного обучения и границ применимости этих методов;
— работали с разными модальностями данных и понимаете, какие методы ML/DL применимы в конкретных бизнес-задачах;
— имеете опыт решения различных Data Science задач с использованием Python;
— понимаете принципы продовой эксплуатации моделей в near-real-time контуре;
— уверенно владеете SQL и умеете извлекать необходимые данные для анализа и обучения моделей;
— умеете оценивать не только качество моделей при запуске нового проекта, но и его изменение во времени;
— умеете читать технические статьи и документацию на английском языке.
Работа у нас — это:
— возможность улучшать опыт миллионов пользователей;
— интересные и сложные задачи на большом масштабе;
— сильная команда, которая всегда готова прийти на помощь;
— возможность изучать и пробовать новое, мощное железо для этого;
— бюджет на обучение, который можно тратить на курсы или профессиональную литературу;
— забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;
— возможность работать удалённо или из офисов в четырёх городах России.