
MomentaBMC系统集成高级/资深工程师
任职要求
任职要求: - 精通 C/C++,熟悉嵌入式系统开发流程,有实际 MCU/SoC 平台开发经验。 - 熟悉至少一种嵌入式操作系统:RTOS(FreeRTOS、QNX、VxWorks)或 Linux(Yocto、Buildroot)。 - 熟悉常见中间件框架:如 AUTOSAR Classic/Adaptive、ROS2、Cyber RT、DDS(Fast DDS、RTI Connext)。 - 了解自动驾驶系统架构,熟悉传感器(Camera、Radar、LiDAR)数据流、通信协议(CAN、Ethernet、SPI、I2C)。 - 有系统集成或联调经验,能独立完成跨模块、跨层级的系统打通。 - 精通C/C++编程,熟悉常用数据结构和算法, 扎实的计算机软件基础 - 深入理解Linux系统调用、进程管理、内存管理、文件系统、设备驱动…
工作职责
职责描述: - 负责自动驾驶域控制器或计算平台的底层软件集成,包括 MCU 固件、BSP(板级支持包)、RTOS/Linux 驱动、中间件的部署与联调。 - 与算法/应用团队协作,完成算法模块(感知、规划、控制)在目标平台上的部署、性能调优与稳定性保障。 - 分析并解决系统级问题(如死锁、内存泄漏、时序异常、通信丢包等),提供根因分析与优化方案。 - 参与系统架构设计评审,提出可集成性、可维护性、可扩展性改进建议。
-负责服务器固件(BIOS、BMC)的全流程设计、开发与调试工作,确保产品功能稳定可靠 -参与固件架构设计,优化固件性能,提升系统启动速度和稳定性 -同硬件团队紧密合作,完成固件与硬件的集成测试,解决兼容性问题 -编写固件开发文档,包括设计文档、测试报告及用户手册等 -跟踪固件行业动态,研究新技术,为产品升级提供技术支撑
1、负责服务器产品的系统集成测试工作,确保服务器系统的功能完整性、软硬件兼容性、性能、可靠性; 2、和合作伙伴联合工作,确保服务器产品在研发阶段的测试覆盖效果;包括整体测试方案制定、测试计划、测试用例review、测试报告审查等工作; 3、分析测试过程中发现的故障与缺陷,为设计部门寻找故障根源提供支持,并通过缺陷分析不断调整、优化测试方案和执行力度,确保测试效果; 4、投入性能测试及调优,包括基准性能测试及协助业务进行硬件相关的性能分析与调优; 5、研究、引入新的部件和技术,并验证落地,支持服务器系统的竞争力提升; 6、负责维护自动化测试用例以及代码开发,审核供应商研发各个阶段测试计划以及测试报告,确保服务器研发质量达标。

我们正在寻找一位经验丰富的模块测试工程师,专注于服务器核心模块与子系统的深度测试与验证。您将负责从单元到系统级的测试策略设计、自动化实现与问题定位,确保服务器各关键模块(如内核/虚拟化、高速总线、编解码等)的功能、性能、可靠性及兼容性满足严苛的行业标准。您需要对服务器硬件架构与软件栈有深入理解,并能通过创新的测试方法发现潜在缺陷,为产品的高质量交付提供坚实保障。 岗位职责: 1. 服务器核心模块测试策略与执行:负责制定和执行服务器关键模块的测试计划,特别是在如下某一个或者某几个核心模块有扎实测试专长的候选人加入: a. 内核与虚拟化模块:测试虚拟化技术(如KVM, VMware ESXi)、容器运行时、内核关键子系统(调度、内存管理、网络栈)的功能、性能隔离与稳定性。 b. 高速互连总线模块:负责PCIe, CXL, NVLink等高速总线的功能验证、带宽/延迟性能基准测试、错误注入与容错测试。 c. 硬件加速与编解码模块:测试GPU、视频编解码器(如H.264/HEVC/AV1)、加解密引擎等硬件加速单元的功能正确性、性能提升及驱动兼容性。 d. 固件与BMC模块:参与服务器固件(BIOS/UEFI)、基板管理控制器(BMC)的接口、安全与可靠性测试。 2. 测试框架与自动化开发:针对特定模块,设计并开发高覆盖率的自动化测试套件、压力测试工具和性能基准测试框架。集成到CI/CD流水线,实现模块质量的持续监控。 3. 深度分析与问题定位:执行测试并分析结果,能深入日志、硬件寄存器、性能计数器等,对发现的缺陷进行根因分析,准确定位至硬件、固件、驱动或应用层,并与研发团队紧密协作推动问题解决。 4. 系统级集成与可靠性验证:将模块测试融入整机系统测试,验证多模块协同工作下的功能与性能,设计并执行长时压力、故障恢复、容错等可靠性测试场景。 5. 技术预研与能力建设:跟踪服务器技术演进(如新硬件架构、互联协议、虚拟化技术),预研新的测试方法、工具与标准,提升团队在特定模块领域的测试深度与效率。
团队介绍:字节跳动数据中心与供应链部门,负责字节跳动从芯片到服务器全栈算力基础设施的研发、调度与供给、管理与应用(如数据中心建设、内核操作系统、网络CDN、高性能服务器、编译工具链等),支撑字节跳动全系业务运行的核心力量,为抖音、今日头条、飞书、火山引擎等各类产品提供全面、领先、稳定的百万量级大规模算力基础设施服务。 1、系统软件开发:参与BIOS、BMC固件、Linux内核及操作系统相关模块的开发,解决底层硬件兼容性以及功能扩展问题,实现软硬件一体化集成; 2、系统优化与维护:对BIOS、BMC固件、Linux内核及操作系统进行性能测试、分析、优化,定位并解决系统运行过程中的各类问题,保障系统高效稳定运行; 3、系统监控诊断:设计与实现系统监控诊断相关功能,开发监控工具或模块,实时监测BIOS、BMC固件、Linux内核及操作系统的运行状态,及时发现并预警潜在故障,协助排查和解决系统故障; 4、新技术探索与应用:关注系统软件领域最新技术动态,如人工智能在系统诊断中的应用、系统技术在AI基础设施中的应用等,结合公司业务需求,探索新技术在项目中的可行性,提出创新方案并实践验证。