Data Scientist в команду Data Gathering

В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com

О команде

Авито - компания, сервисами которой пользуются миллионы человек ежедневно, и мы в команде Data Gathering занимаемся разработкой платформы, которая позволяет собирать, обогащать и управлять данными о наших пользователях. Мы строим сложные ML модели на основе больших массивов, как внутренних данных Авито, так и внешних от наших партнеров. Результаты нашей работы широко используются во внутренней аналитике, антифроде, монетизационных продуктах, а также помогают Авито выстраивать лучшую персональную коммуникацию с пользователями.

Мы ищем сильного и амбициозного DS-инженера, который поможет нам в обработке и исследовании самых разных признаков, и в создании моделей, которые эти признаки предсказывают.

Примеры будущих задач:

—  Построение ML моделей для предсказания важных параметров о пользователях Авито. К примеру, нам необходимо будет по большому набору данных понять, что пользователь хочет продать недвижимость еще до того, как он разместит объявление о продаже;

— Определение влияния новых признаков на существующие скоринговые модели. Например, проверить какой аплифт дают новые признаки от наших партнеров на качество уже существующих моделей, которые определяют недобросовестных пользователей на Авито. 

Вам предстоит:

— строить ML решения, начиная от формулирования гипотезы, сбора данных и заканчивая выводом модели в продакшн, и добавлением алертов;

—  анализировать качество моделей, генерировать, собирать и тестировать новые гипотезы совместно с заказчиками из разных команд в Авито;

—  оценивать полезность внешних данных для бизнеса, в рамках проверки влияния новых фичей на ключевые метрики на основе АБ тестов совместно с продактом и аналитиком.

Мы ждём, что вы:

—    хорошо понимаете ML-алгоритмы (классические и основные архитектуры нейронных сетей);

—    имеете опыт работы и внедрения ML-моделей в продакшн;

—    пишете хороший, поддерживаемый, тестируемый и масштабируемый код на Python;

—    владеете стеком:  CatBoost, Pandas, NumPy, SkLearn, PyTorch;

—    имеете опыт работы с микросервисами на Python, Docker’ом, SQL- и noSQL-базами;

—   владеете английским языком на уровне, как минимум, позволяющем бегло читать специализированную литературу.

Будет здорово, если вы:

—  получили высшее образование в области вычислительной математики, статистики, анализа данных и т.п.;

—   участвовали в различных открытых соревнованиях по анализу данных;

—   работали с современными NLP моделями.

Работа у нас — это:

— возможность улучшать опыт миллионов пользователей;

— интересные и сложные задачи на большом масштабе;

— сильная команда, которая всегда готова прийти на помощь;

— возможность изучать и пробовать новое, мощное железо для этого;

— бюджет на обучение, который можно тратить на курсы или профессиональную литературу;

— забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;

— возможность работать удалённо или из офисов в четырёх городах России.