Data Scientist в команду антифрода
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
Наша команда разрабатывает и поддерживает алгоритмы скоринга пользователей, проверки коммуникации между ними, противодействия фроду.
Сейчас мы ищем ML-инженера, который усилит часть команды, ответственную за защиту от фрода монетизации Авито и наших профессиональных пользователей.
Примеры будущих задач:
— поиск нецелевого использования внутренних транзакционных механизмов: сомнительные финансовые операции, модели для AML (anti-money laundering);
— защита монетизационных механизмов CPA (cost-per-action) и CPT (cost-per-transaction): детекция различных факторов, начиная от отправки scam-ссылок и подозрительных телеграм-каналов, и заканчивая отправленными номерами телефонов в голосовых сообщениях;
— борьба с накрутками поведенческих факторов в поиске и со скликиванием в CPC (cost-per-click) тарифах.
Вам предстоит:
— улучшать алгоритмы поиска фрода в сервисе, который обрабатывает тысячи событий в минуту;
— искать нетривиальные и эффективные решения реальных бизнес-задач;
— постоянно улучшать средства поиска фрода, чтобы они соответствовали постоянно изменяющейся внешней среде;
— экспериментировать со state-of-the-art методами машинного обучения в тех случаях, когда применение таких методов оправдано решаемой задачей;
— разрабатывать и собственноручно внедрять новые модели для решения продуктовых задач, взаимодействуя с талантливой командой разработчиков и аналитиков. А после внедрения, улучшать модели на основе данных и явного фидбэка от потребителей данных решений (как асессоров, так и от нарушителей наших правил).
Мы ждём, что вы:
— обладаете глубоким пониманием ключевых методов, применяемых при решении задач машинного обучения и границ применимости этих методов;
— имеете опыт решения различных Data Science-задач с использованием Python;
— работали с разными модальностями данных и понимаете какие методы ML/DL применимы в конкретных бизнес-задачах;
— умеете оценивать не только качество моделей при запуске нового проекта, но и изменение качества во времени;
— умеете писать SQL запросы;
— получили высшее образование в области вычислительной математики, статистики, анализа данных и т.п.;
— владеете английским языком на уровне, как минимум, позволяющем бегло читать специализированную литературу.
Будет здорово, если вы:
— участвовали в различных открытых соревнованиях по анализу данных;
— проектировали и внедряли системы машинного обучения для автоматизации процессов и получили измеримые результаты этого внедрения;
— умеете обращаться с системами управления версиями (например, git), склонны документировать свои наработки, а также описывать и всесторонне критически оценивать результаты проведённых экспериментов.