Data Scientist в команду Horizontal ML Technologies (GenAI)
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
Наша команда создает и развивает технологии, которые используются во всем Авито. Мы отвечаем за распознавание и синтез звука, OCR, ряд продуктовых метрик, создаем модели для маркетинга и инструменты для GenAI. Мы тщательно подходим к сбору и разметке данных, проводим разные исследования, обучаем свои модели, пишем высоконагруженные сервисы, занимаемся аналитикой.
Мы ищем талантливого коллегу, который усилит стрим GenAI. Работа будет разнообразной — от проведения исследований до вывода моделей в продакшн.
Вам предстоит:
- мультимодальная валидация документов и креативов. Построение пайплайнов проверки финансовых документов и фото/видео на соответствие регуляторным требованиям с помощью связки VLM + LLM;
- интеллектуальный ресайз и адаптация баннеров. Разработка алгоритмов перераспределения элементов на холсте под разные форматы рекламных площадок;
- развитие генеративного стека. Оптимизация и вывод из MVP в highload текущих решений, снижение стоимости, ускорение генерации изображений и текстов и повышение качества сгенерированных креативов;
- GenAI для performance-сегментации. Кластеризация пользователей для повышения конверсии в маркетинговых коммуникациях;
- участие в ревью существующих сервисов и их улучшение.
Мы ждём, что вы:
- широкая насмотренность, понимание и опыт работы с VLM и LLM;
- пишете хороший, поддерживаемый, тестируемый и масштабируемый код на Python;
- глубоко понимаете ML-алгоритмы и знаете особенности их эксплуатации;
- навыки оркестрации LLM-агентов и промпт-инжиниринга;
- умеете общаться с бизнесом простым языком, объяснять метрики и результаты;
- любите учиться новому и быстро погружаться в незнакомые области.
Будет здорово, если вы:
- знаете классический CV. Умение решать задачи манипуляции с холстом и выравнивания без GPU там, где это эффективнее
- работали со структурой макетов. Понимание Figma API и принципов парсинга дизайн-слоев
- развертывали Open-Source моделей и файнтюнили их под свои задачи
- участвовали в соревнованиях/хакатонах по ML, занимали призовые места.
Работа у нас — это:
- возможность улучшать опыт миллионов пользователей;
- интересные и сложные задачи на большом масштабе;
- сильная команда, которая всегда готова прийти на помощь;
- возможность изучать и пробовать новое, мощное железо для этого;
- бюджет на обучение, который можно тратить на курсы или профессиональную литературу;
- забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;
- возможность работать удалённо или из офисов в четырёх городах России.