Старший Data Scientist / DS Tech Lead в платформу анализа коммуникаций (Natural Language Processing)
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
Мы строим платформу, которая позволит всем командам Авито быстро и эффективно решать возникающие задачи по анализу коммуникаций: к примеру, защищать пользователей от нежелательных звонков, телефонного спама и мошенничества, а также анализировать эффективность общения между пользователями.
Важной частью этой платформы являются модели классификации текстов, работа над которыми подразумевает широкий спектр задач — от организации процесса разметки данных для обучения до экспериментов с sota-решениями и их выкатки в production.
Мы ищем сильного кандидата, который готов развивать данное направление и вести за собой команду единомышленников.
Вам предстоит:
— продумывать цели на квартал, следить за тем, что они приносят ценность, амбициозны, достижимы, поддаются измерению и согласованы с другими командами;
— реализовать новую функциональность своими руками примерно 40% рабочего времени и своим примером показывать, как это нужно делать;
— отвечать за качество реализуемых решений, участвовать в код ревью, ревью архитектуры, следить за покрытием метриками, тестами и алёртами;
— заниматься командой, поддерживая регулярные Scrum-процессы (планирование, стендап, демо, ретро), при необходимости вводить новые и прекращать ненужные. Важно заботиться о своих сотрудниках, проводить с каждым регулярные 1-1 и вникать в их проблемы, стремиться их решать, а также помогать развиваться.
Мы ждём, что вы:
— имеете опыт управления командой ML-инженеров от полугода или успешно менторили коллег в роли individual contributor (IC) и заинтересованы перейти на менеджерский трек;
— владеете ML на уровне Senior DS (с уклоном в NLP и классический ML);
— имеете опыт реализации и эксплуатации ML-решений от 4 лет;
— умеете качественно размечать данные для своих задач;
— владеете стеком: pandas, sklearn, catboost, PyTorch;
— имеете опыт работы с микросервисами на Python, Docker’ом, SQL и noSQL базами.
Будет здорово, если вы:
— имеете опыт в построении систем речевой аналитики или автоматизации поддержки;
— знаете, как строго замерить влияние на продукт и бизнес в данных задачах и имеете измеримые достижения на предыдущих местах работы;
— знаете, как выстроить устойчивую и масштабируемую инфраструктуру для решения данных задач в production.