Data Scientist в команду антифрода

Вакансия закрыта. Посмотреть похожие

В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com

О команде

Наша команда разрабатывает и поддерживает алгоритмы скоринга пользователей, проверки коммуникации между ними, противодействия фроду.

Сейчас мы ищем ML-инженера, который усилит часть команды, ответственную за защиту от фрода монетизации Авито и наших профессиональных пользователей.

Примеры будущих задач:

— поиск нецелевого использования внутренних транзакционных механизмов: сомнительные финансовые операции, модели для AML (anti-money laundering);

— защита монетизационных механизмов CPA (cost-per-action) и CPT (cost-per-transaction): детекция различных факторов, начиная от отправки scam-ссылок и подозрительных телеграм-каналов, и заканчивая отправленными номерами телефонов в голосовых сообщениях;

— борьба с накрутками поведенческих факторов в поиске и со скликиванием в CPC (cost-per-click) тарифах.

Вам предстоит:

— улучшать алгоритмы поиска фрода в сервисе, который обрабатывает тысячи событий в минуту;

— искать нетривиальные и эффективные решения реальных бизнес-задач;

— постоянно улучшать средства поиска фрода, чтобы они соответствовали постоянно изменяющейся внешней среде;

— экспериментировать со state-of-the-art методами машинного обучения в тех случаях, когда применение таких методов оправдано решаемой задачей;

— разрабатывать и собственноручно внедрять новые модели для решения продуктовых задач, взаимодействуя с талантливой командой разработчиков и аналитиков. А после внедрения, улучшать модели на основе данных и явного фидбэка от потребителей данных решений (как асессоров, так и от нарушителей наших правил).

Мы ждём, что вы:

— обладаете глубоким пониманием ключевых методов, применяемых при решении задач машинного обучения и границ применимости этих методов;

— имеете опыт решения различных Data Science-задач с использованием Python;

— работали с разными модальностями данных и понимаете какие методы ML/DL применимы в конкретных бизнес-задачах;

— умеете оценивать не только качество моделей при запуске нового проекта, но и изменение качества во времени;

— умеете писать SQL запросы;

— получили высшее образование в области вычислительной математики, статистики, анализа данных и т.п.;

— владеете английским языком на уровне, как минимум, позволяющем бегло читать специализированную литературу.

Будет здорово, если вы:

— участвовали в различных открытых соревнованиях по анализу данных;

— проектировали и внедряли системы машинного обучения для автоматизации процессов и получили измеримые результаты этого внедрения;

— умеете обращаться с системами управления версиями (например, git), склонны документировать свои наработки, а также описывать и всесторонне критически оценивать результаты проведённых экспериментов.