字节跳动服务器性能评估与验证实习生-算力基础设施
任职要求
1、2026届硕士及以上学位在读,计算机、电子、通信、网络及相关专业优先; 2、掌握X86/ARM/RISC-V等各架构CPU中一种或多种架构的性能评估测试方法,熟悉计算系统Benchmark评价体系,具备数据挖掘分析能力、性能评估数学模型理论研究经验等; 3、掌握GPU测试方法及原理,掌握了解P2P、GPU虚拟化、GDR、NCLL等测试,熟悉了解MLPerf、CNN模型、Transformer等模型,了解深度学习、机器学习测试方法; 4、熟悉服务器各硬件模块基础知识,掌握系统整合测试、部件测试的测试用例、测试方法及原理,熟练使用相关测试工具; 5、熟悉Linux操作系统,具备脚本开发能力,编写开发自动化测试用例;具备较强的问题分析及调试能力。对服务器测试有深刻的理解,能以全局出发,考量各测试设计点及测试合理性; 6、良好的沟通及团队协作能力,有较强的学习动手能力及知识迁移能力。
工作职责
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、负责数据中心X86/ARM/GPU等多样性计算系统的性能评估与验证工作,提取与分析业务模型,制定针对性的评估方案,论证与优化服务器产品硬件架构设计的竞争力; 2、负责服务器硬件性能评估体系建,提升对芯片选型、缺陷识别、机型导入、TCO核算等业务的支撑能力,形成更符合字节跳动业务场景、架构设计合理、产品组合最优的落地表现; 3、参与服务器业务应用数据挖掘工作,提炼设计优化点,提升服务器在字节跳动业务场景落地的竞争力; 4、负责数据中心多样性计算的的系统测试设计、测试方案及测试执行,对异构硬件系统的功能、性能、可靠性验证质量负责; 5、跟进GPU服务器研发测试、生产测试及线上质量问题,结合研发、生产及现网质量问题,进行GPU故障预测,落地新测试场景、测试方法,推动GPU选型标准化、流程化; 6、跟进和探索CPU、GPU测试理论和测试方法,寻找合适的技术路径,支撑新技术的快速验证、形成评估结论,支撑新产品研发和产品化交付。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、负责数据中心X86/ARM/GPU等多样性计算系统的性能评估与验证工作,提取与分析业务模型,制定针对性的评估方案,论证与优化服务器产品硬件架构设计的竞争力; 2、负责服务器硬件性能评估体系建,提升对芯片选型、缺陷识别、机型导入、TCO核算等业务的支撑能力,形成更符合字节跳动业务场景、架构设计合理、产品组合最优的落地表现; 3、参与服务器业务应用数据挖掘工作,提炼设计优化点,提升服务器在字节跳动业务场景落地的竞争力; 4、负责数据中心多样性计算的的系统测试设计、测试方案及测试执行,对异构硬件系统的功能、性能、可靠性验证质量负责; 5、跟进GPU服务器研发测试、生产测试及线上质量问题,结合研发、生产及现网质量问题,进行GPU故障预测,落地新测试场景、测试方法,推动GPU选型标准化、流程化; 6、跟进和探索CPU、GPU测试理论和测试方法,寻找合适的技术路径,支撑新技术的快速验证、形成评估结论,支撑新产品研发和产品化交付。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、参与高性能服务器芯片的板级、系统级验证(Post-Silicon Validation)、评估与SLT(System Level Test)测试;支撑芯片的产品化集成验证与评估和量产导入; 2、负责设计、开发、移植、维护系统级测试、压力测试、边界/异常测试等各类测试工具; 3、负责测试问题的初步定位与复现,分析测试过程中发现的缺陷及其分布规律,为设计团队寻找故障根源提供支持,并通过缺陷分析不断调整、优化测试方案和执行力度,确保项目质量符合预期; 4、负责PCIe/SATA/NVMe/DDR/互联/网络等高速接口IO的电性能、兼容性、协议一致性、电路裕量、常稳/环境可靠性等验证与评估; 5、参与性能测试及调优,包括不同PVT场景下的基准性能测试及协助业务进行硬件和芯片相关的性能分析与调优; 6、负责自动化测试框架搭建/维护和用例开发,提高测试效率和覆盖效果。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、负责数据中心X86/ARM/GPU等核心部件GPU和SSD部件的选型评估测试,根据应用场景和要求,测试和评估功能、性能和可靠性等,结合服务器产品进行软硬件结合优化和性能提升; 2、负责服务器部件级的测试体系建设,提升对部件选型、缺陷识别、机型导入、TCO核算等业务的支撑能力,形成更符合字节跳动业务场景、架构设计合理、产品组合最优的落地表现; 3、参与服务器业务应用数据挖掘工作,提炼设计优化点,提升服务器GPU、SSD在字节跳动业务场景落地的竞争力; 4、负责数据中心服务器GPU、SSD等部件的测试设计、测试方案及测试执行,对异构硬件系统的功能、性能、可靠性验证质量负责; 5、跟进GPU服务器研发测试、生产测试及线上质量问题,结合研发、生产及现网质量问题,进行GPU故障预测,落地新测试场景、测试方法,推动GPU选型标准化、流程化; 6、跟进和探索GPU测试理论和测试方法,寻找合适的技术路径,支撑新技术的快速验证、形成评估结论,支撑新产品研发和产品化交付。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、负责数据中心X86/ARM/GPU等核心部件GPU和SSD部件的选型评估测试,根据应用场景和要求,测试和评估功能、性能和可靠性等,结合服务器产品进行软硬件结合优化和性能提升; 2、负责服务器部件级的测试体系建设,提升对部件选型、缺陷识别、机型导入、TCO核算等业务的支撑能力,形成更符合字节跳动业务场景、架构设计合理、产品组合最优的落地表现; 3、参与服务器业务应用数据挖掘工作,提炼设计优化点,提升服务器GPU、SSD在字节跳动业务场景落地的竞争力; 4、负责数据中心服务器GPU、SSD等部件的测试设计、测试方案及测试执行,对异构硬件系统的功能、性能、可靠性验证质量负责; 5、跟进GPU服务器研发测试、生产测试及线上质量问题,结合研发、生产及现网质量问题,进行GPU故障预测,落地新测试场景、测试方法,推动GPU选型标准化、流程化; 6、跟进和探索GPU测试理论和测试方法,寻找合适的技术路径,支撑新技术的快速验证、形成评估结论,支撑新产品研发和产品化交付。