Data scientist в команду автоматического определения параметров

В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com

О команде

В команде item2param мы разрабатываем платформу для автоматического определения параметров объявлений по описанию и изображениям. Это помогает пользователю быстро и правильно разместить объявление, а покупателю быстрее найти то, что он ищет. Параметры могут быть совершенно разные. Например, «Наименование профессии» в вакансиях, «Цвет» в личных вещах или категории объявления.

Сейчас у нас в продакшене уже работает более двухсот моделей, которые используются в различных сценариях:

— Подсказка или автозаполнение параметров в момент подачи объявления и последующая модерация;
— Классификация объявлений на те, которые можно доставить и нет;

— Подсказка названия товара по фото;

— В качестве признаков для моделей других команд.

Наша задача - научиться предсказывать все параметры, которые есть на Авито, а их несколько тысяч и с каждым днём становится все больше. Мы ищем сильного и амбициозного DS-инженера, который поможет нам достичь этой цели.

Примеры будущих задач:

— Автоматизация обучения: настраивание пайплайнов для переобучения, сбора данных и мониторинга качества;

— Масштабирование и оптимизация сервиса под растущую нагрузку(тысячи запросов в секунду) и под новые модели;

— Улучшение качества текущих моделей: работа как с текстом, так и с изображениями;

— Добавление новых сценариев: например, возможности определения текстовых параметров(задача ner).

Мы ждём, что вы:

— понимаете, как устроены основные ML алгоритмы (от решающих деревьев, до трансформеров);

— имеете опыт работы и внедрения ML моделей в продакшн;

— знаете Python.

Будет здорово, если вы:

— Пишете хороший, поддерживаемый, тестируемый и масштабируемый код на Python;

— Хорошо понимаете ML алгоритмы (классические и основные архитектуры нейронных сетей), умеете их обучать, понимаете, что главное в улучшении моделей, и способны систематически улучшать их перфоманс;

— Умеете использовать PyTorch для решения задач анализа изображений и текстов, а также способны кастомизировать архитектуры под свои задачи;

— Имеете опыт эксплуатации ML сервисов в продакшн.

Работа у нас — это:

— возможность улучшать опыт миллионов пользователей;

— интересные и сложные задачи на большом масштабе;

— сильная команда, которая всегда готова прийти на помощь;

— возможность изучать и пробовать новое, мощное железо для этого;

— бюджет на обучение, который можно тратить на курсы или профессиональную литературу;

— забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;

— возможность работать удалённо или из офисов в четырёх городах России.