Data Engineer в команду Integration (Migration)

В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com

О команде

Мы — команда хранилища данных Авито. У нас есть более сотни внутренних и внешних систем, из которых мы получаем данные. Мы строим отчётность, помогаем бизнесу проверять гипотезы и принимать решения, а также выбирать эффективные способы достижения целей, основанные на этих данных.

Наша цель — сделать так, чтобы новичок мог самостоятельно, без помощи инженеров находить ответы в данных и настраивать новые пайплайны обработки данных под свои цели.

Примеры будущих задач:

Мы находимся в процессе миграции наших расчетов с Vertica на Trino.. Мы не просто меняем одну СУБД на другую. Мы меняем модель хранилища данных с монолитного центрально хранилища на эластичную модель lakehouse с более гибкими возможностями по масштабированию и изоляции расчетов.

Наши вызовы - сделать работу аналитиков с Trino такой же привычной и удобной как работу с Vertica, начать давать гарантии готовности данных к сроку, оптимизировать модель хранения данных. Нам нужно быть быстрыми и удобными для аналитиков, научиться гибко управлять ресурсами хранилища.

Вам предстоит:

  • перевести критичные расчеты на Trino; 
  • оптимизировать запросы, модель данных в расчетах, ускорить обращение к данным в ceph и метаданным в hive;
  • сделать Trino основным местом для создания новых расчетов в хранилище.

Мы ждём, что вы:

  • имеете опыт работы с аналитическими СУБД (Vertica, Snowflake, Clickhouse, StarRocks, Presto, Trino и др.);
  • знаете что для СУБД значит выполнить SQL-запрос и понимаете как оптимизировать аналитические запросы;
  • имеете опыт разработки пайплайнов обработки данных.

Будет здорово, если вы:

  • уже работали с Trino или Presto;
  • понимаете необходимость моделирования данных; 
  • имеете опыт оптимизации потребления ресурсов;
  • знаете и умеете писать на java или python.

Работа у нас — это:

— интересные и важные задачи на очень большом проекте;

— передовые технологии и подходы, возможность пробовать новое;

— опытные и заинтересованные коллеги, готовые оказать поддержку;

— возможность приносить пользу миллионам пользователей, реализуя решения, основанные на данных;

— личный бюджет на обучение, который можно тратить на книги, курсы и конференции;

— забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист;

— возможность работать удаленно и по желанию посещать комфортный офис в Москве или Санкт-Петербурге.