Ведущий инженер R&D (серверное оборудование)
В работе мы ставим амбициозные цели и не останавливаемся на достигнутом. Поэтому для нас так важно, чтобы каждый участник большой команды Авито разделял культуру компании. Погрузиться в неё помогает Манифест, в котором собраны наши основные ориентиры — миссия, ценности, принципы работы manifesto.avito.com
Вам предстоит:
- Развивать текущую методику тестирования серверов: аппаратная проверка, BIOS, BMC, Redfish, IPMI, SNMP, мониторинг, прошивки, RAID, блоки питания, вентиляторы, инвентаризация, документация, совместимость компонентов, тепловые режимы и критерии допуска к закупке.
- Проводить техническую оценку серверов , barebone-платформ, самосборных конфигураций, OCP серверов, GPU-серверов и решений высокой плотности.
- Формировать базовые требования к разработке ODM решений и кастомных доработок OpenBMC.
- Оценивать влияние платформы на ЦОД: питание, PDU, вводы A/B, кВт на стойку, тепловую нагрузку, охлаждение, воздушные потоки, аварийные режимы, плотность размещения и возможность перехода к фрикулингу.
- Формировать подход к тепловым тестам: профили нагрузки, входящая температура, температуры компонентов, троттлинг, поведение вентиляторов, ограничение мощности, стабильность под длительной нагрузкой.
- Учитывать реальные сценарии использования серверов внутренними командами: виртуализация, k8s, DB/DBaaS, Search, Storage/Ceph, DWH, GPU/ML и другие нагрузки.
- Вместе с внутренними заказчиками переводить их требования в требования к платформе, конфигурации и тестам.
- Формировать список совместимых и разрешённых компонентов, правила замены компонентов, допустимые версии прошивок и ограничения по конфигурациям.
- Готовить технические заключения по результатам тестов: допустить, допустить с ограничениями, отправить на доработку, повторно протестировать или отклонить.
Мы ждём, что вы:
- Глубокое понимание серверных платформ: CPU, RAM, NUMA, PCIe, RAID/HBA, NVMe/SAS/SATA, сетевые карты, FC HBA, блоки питания, вентиляторы, riser, backplane, обдув.
- Практический опыт диагностики, тестирования, эксплуатации, проверки или выбора серверных платформ до закупки.
- Опыт работы с BMC и удалённым управлением сервером: Redfish, IPMI, SNMP, SSH/CLI, Web UI, KVM.
- Понимание Redfish, настройки BIOS/BMC, пользователей, ролей, сенсоров, логов и обновлений.
- Навыки постановки ТЗ для кастомных доработок BMC.
- Понимание BIOS/UEFI: профили производительности, энергосбережение CPU, SR-IOV, Secure Boot, PXE, порядок загрузки, отключение USB, восстановление после потери питания, настройки памяти и виртуализации.
- Понимание жизненного цикла прошивок: BIOS, BMC, CPLD, RAID, сетевые карты, HBA, SSD/HDD, GPU, блоки питания. Важно понимать совместимость версий, риски обновлений и восстановление после неуспешного обновления.
- Опыт разработки, аудита или развития методик тестирования серверного оборудования: цель теста, стенд, условия, методика, критерии успешности, протокол, вывод, решение.
- Понимание инженерной инфраструктуры ЦОДа на уровне серверной платформы: питание стоек, PDU, вводы A/B, резервирование, кВт на стойку, тепловая нагрузка, горячий и холодный коридор, воздушные потоки, температурные ограничения, аварийные режимы.
- Понимание тепловых режимов серверов: входящая температура, температуры компонентов, троттлинг, кривые работы вентиляторов, ограничение мощности, плотность размещения, стабильность под длительной нагрузкой.
- Базовое понимание электроники серверных платформ: питание CPU/GPU/RAM, VRM, PCIe-топология, riser, retimer/switch, BMC, CPLD/FPGA/EEPROM/FRU, датчики, термоинтерфейсы.
- Понимание типовых нагрузок: виртуализация, k8s, базы данных, Search, Storage/Ceph, аналитика, GPU/ML.
- Умение связывать характеристики платформы с нагрузкой: CPU/NUMA, память, PCIe, диски, сеть, задержки, пропускная способность, IOPS, стабильность прошивок, тепловое поведение.
- Опыт взаимодействия с внутренними заказчиками или платформенными командами при выборе оборудования под конкретные сценарии.
- Умение работать с поставщиками: формулировать замечания, запрашивать документацию, проверять исправления, фиксировать блокирующие проблемы.
Работа у нас — это:
- Возможность реализовать свои идеи в проекте с многомиллионной аудиторией.
- Талантливая команда, готовая поддержать ваши инициативы.
- Мощное железо, дополнительные мониторы и всё, что нужно для продуктивной работы.
- Прозрачная система премий, достойная зарплата — размер обсудим на собеседовании.
- Личный бюджет на обучение, который можно тратить на книги, курсы и конференции.
- Забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист.
- Замечательный офис в двух минутах от метро «Белорусская»: панорамный вид на центр города, места для уединённой работы и зоны отдыха.