Ведущий Data Scientist в команду DS SWAT
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
Команда DS SWAT долгое время была классическим ML-десантом, решающим проблемы разных бизнес-подразделений. Со временем в команде сформировались выделенные направления, но сохранился пул отдельных разнородных задач. Примеры выделенных направлений: анализ коммуникаций (speech2text и NLP), классификация объявлений (NLP и Computer Vision), предсказание оценки (Tabular, NLP, CV). Примеры отдельных задач: OCR, задача NER.
Вам предстоит:
— улучшать и адаптировать OCR для разных доменов — например, для использования в коротких видео;
— реализовывать SOTA модели для движка speech2text в новом домене;
— создавать устойчивые эмбединги для поиска дублей.
Мы ждём, что вы:
— имеете опыт разработки и эксплуатации продакшен-систем с ML-моделями;
— работали с микросервисами на Python, Docker’ом, SQL- и noSQL-базами;
— имеете большой опыт обучения нейронных сетей.
Будет здорово, если вы:
— успешно участвовали в соревнованиях по машинному обучению;
— умеете размечать данные для решения своих задач.
Работа у нас — это:
— возможность улучшать опыт миллионов пользователей;
— интересные и сложные задачи на большом масштабе;
— сильная команда, которая всегда готова прийти на помощь;
— возможность изучать и пробовать новое, мощное железо для этого;
— бюджет на обучение, который можно тратить на курсы или профессиональную литературу;
— забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;
— возможность работать удалённо или из офисов в четырёх городах России.