Ведущий инженер R&D (серверное оборудование)

Команда Техническая платформа

Локация Москва, гибрид

В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com

Откликнуться

Вам предстоит:

Развивать текущую методику тестирования серверов: аппаратная проверка, BIOS, BMC, Redfish, IPMI, SNMP, мониторинг, прошивки, RAID, блоки питания, вентиляторы, инвентаризация, документация, совместимость компонентов, тепловые режимы и критерии допуска к закупке.
Проводить техническую оценку серверов , barebone-платформ, самосборных конфигураций, OCP серверов, GPU-серверов и решений высокой плотности.
Формировать базовые требования к разработке ODM решений и кастомных доработок OpenBMC.
Оценивать влияние платформы на ЦОД: питание, PDU, вводы A/B, кВт на стойку, тепловую нагрузку, охлаждение, воздушные потоки, аварийные режимы, плотность размещения и возможность перехода к фрикулингу.
Формировать подход к тепловым тестам: профили нагрузки, входящая температура, температуры компонентов, троттлинг, поведение вентиляторов, ограничение мощности, стабильность под длительной нагрузкой.
Учитывать реальные сценарии использования серверов внутренними командами: виртуализация, k8s, DB/DBaaS, Search, Storage/Ceph, DWH, GPU/ML и другие нагрузки.
Вместе с внутренними заказчиками переводить их требования в требования к платформе, конфигурации и тестам.
Формировать список совместимых и разрешённых компонентов, правила замены компонентов, допустимые версии прошивок и ограничения по конфигурациям.
Готовить технические заключения по результатам тестов: допустить, допустить с ограничениями, отправить на доработку, повторно протестировать или отклонить.

Мы ждём, что вы:

Глубокое понимание серверных платформ: CPU, RAM, NUMA, PCIe, RAID/HBA, NVMe/SAS/SATA, сетевые карты, FC HBA, блоки питания, вентиляторы, riser, backplane, обдув.
Практический опыт диагностики, тестирования, эксплуатации, проверки или выбора серверных платформ до закупки.
Опыт работы с BMC и удалённым управлением сервером: Redfish, IPMI, SNMP, SSH/CLI, Web UI, KVM.
Понимание Redfish, настройки BIOS/BMC, пользователей, ролей, сенсоров, логов и обновлений.
Навыки постановки ТЗ для кастомных доработок BMC.
Понимание BIOS/UEFI: профили производительности, энергосбережение CPU, SR-IOV, Secure Boot, PXE, порядок загрузки, отключение USB, восстановление после потери питания, настройки памяти и виртуализации.
Понимание жизненного цикла прошивок: BIOS, BMC, CPLD, RAID, сетевые карты, HBA, SSD/HDD, GPU, блоки питания. Важно понимать совместимость версий, риски обновлений и восстановление после неуспешного обновления.
Опыт разработки, аудита или развития методик тестирования серверного оборудования: цель теста, стенд, условия, методика, критерии успешности, протокол, вывод, решение.
Понимание инженерной инфраструктуры ЦОДа на уровне серверной платформы: питание стоек, PDU, вводы A/B, резервирование, кВт на стойку, тепловая нагрузка, горячий и холодный коридор, воздушные потоки, температурные ограничения, аварийные режимы.
Понимание тепловых режимов серверов: входящая температура, температуры компонентов, троттлинг, кривые работы вентиляторов, ограничение мощности, плотность размещения, стабильность под длительной нагрузкой.
Базовое понимание электроники серверных платформ: питание CPU/GPU/RAM, VRM, PCIe-топология, riser, retimer/switch, BMC, CPLD/FPGA/EEPROM/FRU, датчики, термоинтерфейсы.
Понимание типовых нагрузок: виртуализация, k8s, базы данных, Search, Storage/Ceph, аналитика, GPU/ML.
Умение связывать характеристики платформы с нагрузкой: CPU/NUMA, память, PCIe, диски, сеть, задержки, пропускная способность, IOPS, стабильность прошивок, тепловое поведение.
Опыт взаимодействия с внутренними заказчиками или платформенными командами при выборе оборудования под конкретные сценарии.
Умение работать с поставщиками: формулировать замечания, запрашивать документацию, проверять исправления, фиксировать блокирующие проблемы.

Работа у нас — это:

Возможность реализовать свои идеи в проекте с многомиллионной аудиторией.
Талантливая команда, готовая поддержать ваши инициативы.
Мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы.
Прозрачная система премий, достойная зарплата — размер обсудим на собеседовании.
Личный бюджет на обучение, который можно тратить на книги, курсы и конференции.
Забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист.
Замечательный офис в двух минутах от метро «Белорусская»: панорамный вид на центр города, места для уединённой работы и зоны отдыха.

Про направление Про команду Подготовка к интервью

Ведущий инженер R&D (серверное оборудование)

Вам предстоит:

Мы ждём, что вы:

Работа у нас — это:

Откликнитесь на вакансию

Похожие вакансии