Старший дата-инженер в команду HRDWH
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
О команде
Мы в HRDWH разрабатываем систему для агрегирования в себе HR данных (информацию мы собираем из различных источников внутри компании и представляем ее в виде наглядных дашбордов для руководителей).
Также новая база призвана стать основной для необходимой пипл-аналитики.
Наша цель - сделать так, чтобы любой руководитель компании мог получить необходимую информацию и принять решение, основанное на достоверных и актуальных данных.
Наш основной вызов до конца года: перевести принятие решений по ключевым пипл-процессам новую в DWH.
Примеры будущих задач:
- инфраструктурные задачи в виде поддержания и настройки своей инсталяции AirFlow;
- разработка большого количества дата пайплайнов для сбора данных из различных источников (IBM PA, Jira, HuntFlow, внутренних данных);
- помощь аналитикам в налаживании сбора и трансформации данных из сырых слоев в данные, готовые для построения отчетности и аналитики;
- налаживание процессов работы с качеством данных.
Будет здорово, если вы:
- имеете опыт построения с нуля систем хранилища данных;
- уже работали с Trino или Presto;
- понимаете необходимость моделирования данных;
- имеете опыт оптимизации потребления ресурсов;
- умеете писать на Java.