Data Scientist в команду антифрода
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
Наша команда разрабатывает и поддерживает алгоритмы скоринга пользователей, проверки коммуникации между ними, противодействия спаму и фроду.
Сейчас мы ищем ML-инженера, который усилит часть команды, ответственную за обеспечение безопасности совершения сделки в каждом канале и типе коммуникаций внутри контура Авито.
Примеры будущих задач:
- поиск и генерация идей по борьбе с новыми схемами фрода и спама;
- построение моделей и инструментов для детекции подозрительных паттернов в коммуникациях, начиная от уводов в другие каналы связи и заканчивая намеренными обфускациями текста в обход проверок Авито;
- разработка моделей для скоринга поведения и активности юзеров на предмет фрод- и спам-паттернов в коммуникациях.
Вам предстоит:
- улучшать алгоритмы поиска фрода и спама в сервисе, который обрабатывает тысячи событий в минуту;
- искать нетривиальные и эффективные решения реальных бизнес-задач;
- постоянно улучшать средства поиска фрода, чтобы они соответствовали постоянно изменяющейся внешней среде;
- экспериментировать со state-of-the-art методами машинного обучения в тех случаях, когда применение таких методов оправдано решаемой задачей;
- выкатывать модели в прод, следить за стабильностью работы, писать тесты, искать компромиссы между качеством и скоростью. А после внедрения, улучшать модели на основе данных и явного фидбэка от потребителей данных решений (как асессоров, так и от нарушителей наших правил).
Мы ждём, что вы:
- имеете глубокое понимание ключевых методов, применяемых при решении задач машинного обучения, и границ применимости этих методов;
- имеете опыт решения различных Data Science-задач с использованием Python;
- имеете опыт в решении практических задач, связанных с NLP и табличными данными;
- умеете оценивать не только качество моделей при запуске нового проекта, но и изменение качества во времени;
- умеете писать SQL-запросы;
- умеете обращаться с системами управления версиями (например, git);
- имеете опыт написания production кода.
Будет здорово, если вы:
- участвовали в различных открытых соревнованиях по анализу данных;
- проектировали и внедряли системы машинного обучения для решения реальных бизнес-задач и получили измеримые результаты этого внедрения;
- склонны документировать свои наработки, а также описывать и всесторонне критически оценивать результаты проведённых экспериментов.