Data Scientist в команду антифрода

В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com

О команде

Наша команда разрабатывает и поддерживает алгоритмы скоринга пользователей, проверки коммуникации между ними, противодействия спаму и фроду.

Сейчас мы ищем ML-инженера, который усилит часть команды, ответственную за обеспечение безопасности совершения сделки в каждом канале и типе коммуникаций внутри контура Авито.

Примеры будущих задач:

  • поиск и генерация идей по борьбе с новыми схемами фрода и спама;
  • построение моделей и инструментов для детекции подозрительных паттернов в коммуникациях, начиная от уводов в другие каналы связи и заканчивая намеренными обфускациями текста в обход проверок Авито;
  • разработка моделей для скоринга поведения и активности юзеров на предмет фрод- и спам-паттернов в коммуникациях.

Вам предстоит:

  • улучшать алгоритмы поиска фрода и спама в сервисе, который обрабатывает тысячи событий в минуту;
  • искать нетривиальные и эффективные решения реальных бизнес-задач;
  • постоянно улучшать средства поиска фрода, чтобы они соответствовали постоянно изменяющейся внешней среде;
  • экспериментировать со state-of-the-art методами машинного обучения в тех случаях, когда применение таких методов оправдано решаемой задачей;
  • выкатывать модели в прод, следить за стабильностью работы, писать тесты, искать компромиссы между качеством и скоростью. А после внедрения, улучшать модели на основе данных и явного фидбэка от потребителей данных решений (как асессоров, так и от нарушителей наших правил).

Мы ждём, что вы:

  • имеете глубокое понимание ключевых методов, применяемых при решении задач машинного обучения, и границ применимости этих методов;
  • имеете опыт решения различных Data Science-задач с использованием Python;
  • имеете опыт в решении практических задач, связанных с NLP и табличными данными;
  • умеете оценивать не только качество моделей при запуске нового проекта, но и изменение качества во времени;
  • умеете писать SQL-запросы;
  • умеете обращаться с системами управления версиями (например, git);
  • имеете опыт написания production кода.

Будет здорово, если вы:

  • участвовали в различных открытых соревнованиях по анализу данных;
  • проектировали и внедряли системы машинного обучения для решения реальных бизнес-задач и получили измеримые результаты этого внедрения;
  • склонны документировать свои наработки, а также описывать и всесторонне критически оценивать результаты проведённых экспериментов.
Поделиться
Скопировать ссылку Вконтакте Telegram WhatsApp