Data scientist в команду автоматического определения параметров
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
В команде item2param мы разрабатываем платформу для автоматического определения параметров объявлений по описанию и изображениям. Это помогает пользователю быстро и правильно разместить объявление, а покупателю быстрее найти то, что он ищет. Параметры могут быть совершенно разные. Например, «Наименование профессии» в вакансиях, «Цвет» в личных вещах или категории объявления.
Сейчас у нас в продакшене уже работает более двухсот моделей, которые используются в различных сценариях:
— Подсказка или автозаполнение параметров в момент подачи объявления и последующая модерация;
— Классификация объявлений на те, которые можно доставить и нет;
— Подсказка названия товара по фото;
— В качестве признаков для моделей других команд.
Наша задача - научиться предсказывать все параметры, которые есть на Авито, а их несколько тысяч и с каждым днём становится все больше. Мы ищем сильного и амбициозного DS-инженера, который поможет нам достичь этой цели.
Примеры будущих задач:
— Автоматизация обучения: настраивание пайплайнов для переобучения, сбора данных и мониторинга качества;
— Масштабирование и оптимизация сервиса под растущую нагрузку(тысячи запросов в секунду) и под новые модели;
— Улучшение качества текущих моделей: работа как с текстом, так и с изображениями;
— Добавление новых сценариев: например, возможности определения текстовых параметров(задача ner).
Мы ждём, что вы:
— понимаете, как устроены основные ML алгоритмы (от решающих деревьев, до трансформеров);
— имеете опыт работы и внедрения ML моделей в продакшн;
— знаете Python.
Будет здорово, если вы:
— Пишете хороший, поддерживаемый, тестируемый и масштабируемый код на Python;
— Хорошо понимаете ML алгоритмы (классические и основные архитектуры нейронных сетей), умеете их обучать, понимаете, что главное в улучшении моделей, и способны систематически улучшать их перфоманс;
— Умеете использовать PyTorch для решения задач анализа изображений и текстов, а также способны кастомизировать архитектуры под свои задачи;
— Имеете опыт эксплуатации ML сервисов в продакшн.
Работа у нас — это:
— возможность улучшать опыт миллионов пользователей;
— интересные и сложные задачи на большом масштабе;
— сильная команда, которая всегда готова прийти на помощь;
— возможность изучать и пробовать новое, мощное железо для этого;
— бюджет на обучение, который можно тратить на курсы или профессиональную литературу;
— забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;
— возможность работать удалённо или из офисов в четырёх городах России.