Старший Data Scientist в команду Автоматизации поддержки
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
Наша команда разрабатывает и поддерживает алгоритмы и инструменты для автоматизации работы пользовательской поддержки — Customer Support.
Наша главная цель — автоматизировать решение как можно большей доли потока обращений пользователей, которые были вынуждены обратиться в поддержку. Мы также работаем над тем, чтобы качество автоматически решённых обращений было высоким, а время, которое агенты поддержки тратят на решение обращений, сокращалось.
Примеры будущих задач:
— разрабатывать и внедрять модели для определения тематики обращения пользователей (более 500 классов различных тематик, которые постоянно расширяются новыми и сливаются друг с другом);
— поддерживать и улучшать существующие модели и эвристики для различных классификаций обращений — от простых правил и эвристик до ML-систем с онлайн-инференсом;
— анализировать эффективность решений как на исторических данных, так и в продакшене, с учётом не только оффлайн-метрик качества решения ML-задач, но и бизнес-метрик;
— проводить AB-тесты и выводить модели в прод;
— настраивать сбор разметки и контролировать её качество (как для разметки через асессоров, так и для использования LLM-решений или смешанных форматов получения размеченных датасетов);
— совместно с командой LLM работать над созданием и файн-тюнингом LLM-агентов, которые помогают пользователю решить его проблему по определённой тематике обращения;
— находить нетривиальные и эффективные решения реальных бизнес-задач;
— улучшать существующие способы автоматизации, адаптируя их к постоянно меняющейся внешней среде на основе данных и обратной связи от наших пользователей и агентов поддержки;
— экспериментировать с SOTA-методами машинного обучения в тех случаях, когда применение таких методов оправдано решаемой задачей;
— проектировать и внедрять end-to-end ML-решения;
— отслеживать деградации, следить за метриками в проде и участвовать в непрерывном улучшении моделей после запуска.
Будет здорово, если вы:
— обладаете глубоким пониманием ключевых методов, применяемых при решении задач машинного обучения и границ применимости этих методов;
— работали с разными модальностями данных и понимаете, какие методы ML/DL применимы в конкретных бизнес-задачах;
— имеете опыт решения различных Data Science задач с использованием Python;
— понимаете принципы продовой эксплуатации моделей в near-real-time контуре;
— имеете высшее образование в области прикладной математики, статистики, ML или в смежных областях;
— уверенно владеете SQL и умеете извлекать необходимые данные для анализа и обучения моделей;
— умеете оценивать не только качество моделей при запуске нового проекта, но и его изменение во времени;
— при запуске модели оперируете не только ML-метриками, но также оцениваете влияние разработанного решения на бизнес-метрики, за которые отвечает команда;
— умеете читать технические статьи и документацию на английском языке;
— имеете опыт автоматизации поддержки или в автоматизации иных похожих бизнес-процессов (будет плюсом).
Работа у нас — это:
— возможность улучшать опыт миллионов пользователей;
— интересные и сложные задачи на большом масштабе;
— сильная команда, которая всегда готова прийти на помощь;
— возможность изучать и пробовать новое, мощное железо для этого;
— бюджет на обучение, который можно тратить на курсы или профессиональную литературу;
— забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;
— возможность работать удалённо или из офисов в четырёх городах России.