Присоединяй­тесь
к команде
DS‑инженеров

Разрабатываем модели машинного обучения и применяем их на больших масштабах. Data Science в Авито — это больше 20 млн объявлений в день, 5 млн чатов с применением ML‑моделей и 50+ метрик качества.
/upload/iblock/071/pljowe5u41v99y38yh0nb6shdmqbcxut.png
/upload/iblock/ff4/jjs88a335vuh1fvlx8qq59ksrs3gty2x.png
Влияние на бизнес
Отвечаем за важные процессы и не делаем проекты в стол: наши модели повышают выручку, снижают затраты и улучшают пользовательский опыт. У вас будет возможность видеть результат своей работы.
Современные ML‑модели
Используем близкие к state of the art подходы в различных областях. Определяем, какие решения реально работают, а что применимо только в теории — и раскатываем на пользователей то,
что показывает хороший результат.
Большие данные и развитая инфраструктура
Масштаб Авито позволяет обучать модели на данных миллионов пользователей и применять их под большой нагрузкой. У нас есть кластеры 
для параллельных вычислений, сервера с видеокартами, ML-платформа для запуска моделей в тест по клику — и многое другое.

Направления

Поиск и рекомендации

Учимся лучше угадывать интересы пользователей и показывать подходящие объявления.
Работаем с классическими алгоритмами и современными нейросетями.
Всё под высокой нагрузкой.

Антифрод и модерация

Создаём системы, которые автоматически проверяют весь контент на соответствие правилам.
Работаем с самыми разными моделями: классический ML, тексты, картинки, речь, видео.

Монетизация

Ищем новые способы увеличить выручку, улучшив опыт работы продавцов.
Сочетание машинного обучения, математики и алгоритмов.

AI Lab

Запускаем новые подходы, собственные технологии и платформы, чтобы решать прикладные задачи Авито.

Вертикальные команды DS

Реализуем ML-проекты для разных внутренних бизнес-заказчиков.
Найдутся задачи на любой вкус — от поиска разных версий одного товара до определения габаритов груза.

Стек

Примеры задач

Подсказка и исправление поискового запроса.
Разработка системы автомодерации
видео в объявления.
Размещение объявлений с платным продвижение в поисковой выдаче.
Определение категории и характеристик объявления по заголовку и описанию.
Распознавание взлома учетной записи
Разработка NLP‑модели
для генерации текста объявлений.

Как мы растём

Мы работаем и развиваемся, проходя через заранее известные уровни. Каждый знает, каким путём следует и чему предстоит научиться дальше. Можно расти как инженер или как менеджер.
Как мы растём Как мы растём

О чём рассказываем миру

1 сентября
Магистратура для Data Scientists. Прием заявок до 11 июля
Зарегистрироваться
Статьи Как мы в Авито используем split-тесты для оценки алгоритмов продвижения объявлений Видео LLM в кибербезопасности Статьи Как декомпозиция повышает точность распознавания текста: опыт с фотографиями СТС Статьи Как мы разработали LLM-модель, которая генерирует описания товаров для пользователей Авито Статьи Как мы в Авито предсказываем категории объявлений по описанию Видео Предсказание категории объявления по описанию / фото Видео Про DS в Авито Видео Как мы перешли от марковской цепочки к sasrec модели Видео Автогенерация описаний товаров в Fashion Статьи Доска AI-объявлений Видео Split-тесты или как мы упростили тестирование новых механизмов Монетизации Статьи Автомодерация изображений: как исправлять нарушения, сохраняя количество и качество контента Статьи Как с помощью ML-модели мы помогли исполнителям получать больше заказов на Авито Телеграм канал Доска AI-объявлений Видео Как устроен DS в Авито Видео Предсказание категории объявления по описанию / фото Видео Как мы разрабатываем и применяем LLM для улучшения сервисов в Авито Статьи Как мы обучили Mistral 7B русскому языку и адаптировали для объявлений Авито Видео Data Science Авито Видео Эффективная модерация изображений: как исправлять нарушения, сохраняя количество и качество контента Видео VCG или First Price? Статьи Путь к миру без страданий: как оформить исследовательский проект Статьи Чем занимаются дата-сайентисты в Авито — полный разбор Статьи Как растут data science-инженеры и что советуют синьоры, чтобы развиваться быстрее Статьи Как мы запустили автоматическую модерацию видео в объявлениях Авито
Смотреть всё
Статьи Как мы в Авито используем split-тесты для оценки алгоритмов продвижения объявлений Статьи Как декомпозиция повышает точность распознавания текста: опыт с фотографиями СТС Статьи Как мы разработали LLM-модель, которая генерирует описания товаров для пользователей Авито Статьи Как мы в Авито предсказываем категории объявлений по описанию Статьи Доска AI-объявлений Статьи Автомодерация изображений: как исправлять нарушения, сохраняя количество и качество контента Статьи Как с помощью ML-модели мы помогли исполнителям получать больше заказов на Авито Статьи Как мы обучили Mistral 7B русскому языку и адаптировали для объявлений Авито Статьи Путь к миру без страданий: как оформить исследовательский проект Статьи Чем занимаются дата-сайентисты в Авито — полный разбор Статьи Как растут data science-инженеры и что советуют синьоры, чтобы развиваться быстрее Статьи Как мы запустили автоматическую модерацию видео в объявлениях Авито
Смотреть всё

Чего ждать на собеседовании

Беседа с рекрутером
Во время телефонного звонка обсудим ваш опыт и пожелания по вакансии. Вы сможете задать вопросы о команде и работе в Авито.
Интервью по ML‑теории
На встрече предстоит ответить на вопросы по классическому ML, DL, NLP/CV.
Техническое интервью (Python)
Проверим ваш опыт и навыки в написании кода. Предстоит решить практические задачи и ответить на теоретические вопросы.
Секция ML System Design
Нужно будет спроектировать ML-решение для конкретной бизнес-задачи.
Финальное интервью
Расскажем, чем занимается команда, с какими задачами вам предстоит работать и как у нас устроены процессы. Оценим мотивацию, ценности и софт-скилы.

Материалы, которые
помогут подготовиться

Ничего страшного, если вы не проходили курсы из этого списка — главное, чтобы вы ориентировались в темах, которые они охватывают.