Data Scientist в команду антифрода
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
Наша команда разрабатывает и поддерживает умные алгоритмы скоринга пользователей, а также проверку коммуникации между нашими пользователями. Главная цель команды — минимизировать действия, которые наносят урон нашим пользователям или компании.
Примеры будущих задач:
— создавать модели для детекции парсеров и борьбы с ними;
— добавлять новые признаки в сервис детекции связанных учётных записей;
— совместно с командой Авито Авто выявлять дилеров, которые мимикрируют под частников для обхода нашей системы монетизации;
— изучать поведение конкурентов и перекупщиков на нашей площадке, чтобы защищать пользователей от нежелательных предложений и спама.
Вам предстоит:
— улучшать алгоритмы поиска фрода в сервисе, который обрабатывает тысячи событий в минуту;
— искать и находить нетривиальные и эффективные решения реальных бизнес-задач;
— постоянно улучшать имеющиеся средства поиска фрода, чтобы они соответствовали постоянно изменяющейся внешней среде;
— экспериментировать со state-of-the-art методами машинного обучения в тех случаях, когда применение таких методов оправдано решаемой задачей;
— разрабатывать и собственноручно внедрять новые модели для решения продуктовых задач, взаимодействуя с талантливой командой разработчиков и аналитиков, а после внедрения улучшать их на основе данных и явного фидбэка от потребителей данных решений (как асессоров, так и от нарушителей наших правил).
Мы ждём, что вы:
— обладаете глубоким пониманием ключевых методов, применяемых при решении задач машинного обучения и границ применимости этих методов;
— имеете опыт решения различных Data Science задач с использованием Python;
— работали с разными модальностями данных и понимаете, какие методы ML/DL применимы в конкретных бизнес-задачах;
— умеете оценивать не только качество моделей при запуске нового проекта, но и его изменение во времени;
— умеете писать SQL-запросы;
— получили высшее образование в области вычислительной математики, статистики, анализа данных и т. п.;
— владеете английским языком на уровне, позволяющем как минимум бегло читать специализированную литературу.
Будет здорово, если вы:
— участвовали в различных открытых соревнованиях по анализу данных;
— проектировали и внедряли системы машинного обучения для автоматизации процессов и получили измеримые результаты этого внедрения;
— умеете обращаться с системами управления версиями (например, Git), склонны документировать свои наработки, а также описывать и всесторонне критически оценивать результаты проведённых экспериментов.