
智能互联达摩院-服务器模块测试工程师-RISC V及生态
任职要求
1. 教育背景:本科及以上学历,计算机科学、电子工程、通信工程或相关专业。 2. 专业知识与经验: a. 基础必备: 对于x86或ARM服务器硬件架构与操作系统原理(Linux)有过丰富的经验。 b. 核心要求:具备扎实的计算机体系结构知识,了解CPU、内存、I/O子系统间的工作原理。至少精通以下一个或多个服务器核心模块的深度测试: i. 虚拟化与内核模块 ii. 高速互连总线(如PCIe, CXL) iii. 硬件编解码或加速模块 iv. 固件(BIOS/UEFI/BMC) v. 网络或存储控制器 3. 技术技能: a. 精通自动化测试开发:精通Python,熟练使用Shell,具备从零搭建或扩展模块级自动化测试框架的能力。 b. 熟悉…
工作职责
我们正在寻找一位经验丰富的模块测试工程师,专注于服务器核心模块与子系统的深度测试与验证。您将负责从单元到系统级的测试策略设计、自动化实现与问题定位,确保服务器各关键模块(如内核/虚拟化、高速总线、编解码等)的功能、性能、可靠性及兼容性满足严苛的行业标准。您需要对服务器硬件架构与软件栈有深入理解,并能通过创新的测试方法发现潜在缺陷,为产品的高质量交付提供坚实保障。
岗位职责:
1. 服务器核心模块测试策略与执行:负责制定和执行服务器关键模块的测试计划,特别是在如下某一个或者某几个核心模块有扎实测试专长的候选人加入:
a. 内核与虚拟化模块:测试虚拟化技术(如KVM, VMware ESXi)、容器运行时、内核关键子系统(调度、内存管理、网络栈)的功能、性能隔离与稳定性。
b. 高速互连总线模块:负责PCIe, CXL, NVLink等高速总线的功能验证、带宽/延迟性能基准测试、错误注入与容错测试。
c. 硬件加速与编解码模块:测试GPU、视频编解码器(如H.264/HEVC/AV1)、加解密引擎等硬件加速单元的功能正确性、性能提升及驱动兼容性。
d. 固件与BMC模块:参与服务器固件(BIOS/UEFI)、基板管理控制器(BMC)的接口、安全与可靠性测试。
2. 测试框架与自动化开发:针对特定模块,设计并开发高覆盖率的自动化测试套件、压力测试工具和性能基准测试框架。集成到CI/CD流水线,实现模块质量的持续监控。
3. 深度分析与问题定位:执行测试并分析结果,能深入日志、硬件寄存器、性能计数器等,对发现的缺陷进行根因分析,准确定位至硬件、固件、驱动或应用层,并与研发团队紧密协作推动问题解决。
4. 系统级集成与可靠性验证:将模块测试融入整机系统测试,验证多模块协同工作下的功能与性能,设计并执行长时压力、故障恢复、容错等可靠性测试场景。
5. 技术预研与能力建设:跟踪服务器技术演进(如新硬件架构、互联协议、虚拟化技术),预研新的测试方法、工具与标准,提升团队在特定模块领域的测试深度与效率。
1. 制定并分解芯片测试需求,包括固件(Boot Flows、RAS、UEFI、ACPI等)、电源功耗管理、安全、AI、驱动及框架、操作系统等基础软件 2. 制定芯片所需基础软件、固件等板块的测试方案 3. 编写芯片所需基础软件、固件等板块的测试用例,实现相关自动化框架和自动化脚本 4. 制定相关测试计划并跟踪执行,软硬件结合进行测试验证,保障芯片项目高质量交付 5. 参与国际标准组织,国内标准组织,技术社区等相关测试标准和规范的制定,总结并提炼测试成果,平台化输出贡献社区,完成测试成果内外转化

● 设计开发支持芯片互连系统的固件; ● 设计开发互连系统相关的固件特性,与硬件开发工程师合作完成SOC产品设计,如MemMap/NUMA/RAS/QoS等; ● 熟悉服务器处理器 silicon firmware 设计开发流程,以及 pre-silicon, power-on, post-silicon流程; ● 熟悉simulation/emu/post silicon等debug工具,与硬件开发人员合作完成故障分析与修改,支撑SoC产品验证交付。

1. 负责AI全栈测试,涵盖大语言模型(LLM)、视觉模型(CNN/Transformer等)的精度验证、性能测试。 2. 负责AI工具链测试,包括模型编译优化、量化部署及NPU相关固件、算子、多芯片互联等功能与性能验证; 3. 负责RISC-V工具链测试,包括调试工具(GDB扩展/Trace)及编译器(LLVM/GCC定制)的测试; 4. 设计和执行测试方案,覆盖单元测试、集成测试、系统测试全流程,开发自动化测试用例; 5. 负责AI推理服务全流程测试,包括模型加载、动态批处理、精度验证、资源监控等; 6. 开展AI推理性能基准测试,分析硬件加速效率与瓶颈,提出优化建议;构建高并发压力测试框架,评估服务在QPS、P99延迟、错误率等指标下的稳定性;

1. 负责数据中心典型应用(如Nginx、Redis、Spark/Flink、多媒体、大模型等)的性能分析与优化,结合公司CPU架构特点(如指令集、缓存、多核调度等),制定针对性的优化方案并落地实施,提升应用在公司CPU平台上的运行效率与稳定性 2. 参与行业解决方案的设计与构建,联动硬件团队、产品团队,将应用优化能力整合到解决方案中,支撑互联网、政企等关键行业客户的数字化转型需求 3. 跟踪行业前沿技术趋势(如新型应用框架、虚拟化/容器技术等),开展技术预研与验证,将先进优化方法与工具引入团队,提升团队整体技术能力 4. 撰写应用优化案例、技术白皮书、最佳实践指南等文档,配合市场与销售团队开展技术推广、客户赋能等工作