logo of bytedance

字节跳动CPU软硬件协同工程师-Data

社招全职A224489A地点:深圳状态:招聘

任职要求


1、深入理解计算机体系结构 (x86/ARM64/RISC-V)、编译原理、和C/C++;
2、熟悉服务器CPU芯片架构,了解Core、SNoC、DDRC、和SoC相关IP与协议;
3、理解典型互联网业务架构和逻辑,如微服务、搜推广、AI、大数据、编解码、存储等,有业务性能分析和调优经验,熟悉业界开源Benchmark;
4、有Workload分析、Tracing、切片的经验,理解SimPoint基本原理,了解应用Trace提取和仿真分析;
5、熟悉芯片仿真建模的基本原理和方法,如QEMU/GEM5/NVMain/SystemC等。

加分项:
1、有参与过实际的服务器芯片项目,包括需求分析、架构设计、Specification撰写、或性能分析优化等;
2、熟悉基本的性能分析方法,如PMU/PEBS/LBR/PT、Roofline/Top-down、VTune/Perf/DynamoRIO。

工作职责


1、通过对业务应用和系统软件的分析,基于软件定义芯片设计需求,协同芯片团队完成业界领先的架构设计;
2、负责自研Benchmark体系建设,构建权威的能够反映软件特征的性能分析和评估基准;
3、负责Workload特征提取与分析,以及仿真工具的建设,打造基于Workload进行架构探索和设计的工具链;
4、负责芯片研发阶段的性能仿真、验证和调优,结合架构创新,打造新硬件的性价比优势;
5、负责服务器CPU代际切换优化,解决CPU架构和性能问题,使能新特性,优化Workload性能,确保达到预期性价比目标。
包括英文材料
ARM64+
C+
C+++
微服务+
大数据+
系统设计+
Perf+
相关职位

logo of bytedance
社招A37524

1、通过对业务应用和系统软件的分析,基于软件定义芯片设计需求,协同芯片团队完成业界领先的架构设计; 2、负责自研Benchmark体系建设,构建权威的能够反映软件特征的性能分析和评估基准; 3、负责Workload特征提取与分析,以及仿真工具的建设,打造基于Workload进行架构探索和设计的工具链; 4、负责芯片研发阶段的性能仿真、验证和调优,结合架构创新,打造新硬件的性价比优势; 5、负责服务器CPU代际切换优化,解决CPU架构和性能问题,使能新特性,优化Workload性能,确保达到预期性价比目标。

更新于 2025-04-03
logo of bytedance
社招A19641

1、通过对业务应用和系统软件的分析,基于软件定义芯片设计需求,协同芯片团队完成业界领先的架构设计; 2、负责自研Benchmark体系建设,构建权威的能够反映软件特征的性能分析和评估基准; 3、负责Workload特征提取与分析,以及仿真工具的建设,打造基于Workload进行架构探索和设计的工具链; 4、负责芯片研发阶段的性能仿真、验证和调优,结合架构创新,打造新硬件的性价比优势; 5、负责服务器CPU代际切换优化,解决CPU架构和性能问题,使能新特性,优化Workload性能,确保达到预期性价比目标。

更新于 2025-04-02
logo of bytedance
社招A144861B

1、通过对业务应用和系统软件的分析,基于软件定义芯片设计需求,协同芯片团队完成业界领先的架构设计; 2、负责自研Benchmark体系建设,构建权威的能够反映软件特征的性能分析和评估基准; 3、负责Workload特征提取与分析,以及仿真工具的建设,打造基于Workload进行架构探索和设计的工具链; 4、负责芯片研发阶段的性能仿真、验证和调优,结合架构创新,打造新硬件的性价比优势; 5、负责服务器CPU代际切换优化,解决CPU架构和性能问题,使能新特性,优化Workload性能,确保达到预期性价比目标。

更新于 2025-04-10
logo of bytedance
社招3年以上A245331

1、负责字节跳动全球百万级服务器硬件监控体系及自动化运维体系的建设工作;深度参与线上新机型、新硬件及新场景的硬件监控方案制定与适配流程,精准定义并持续完善各类硬件故障判断标准,显著提升硬件监控的准确率与召回率,为服务器稳定运行保驾护航; 2、针对线上复杂的服务器硬件疑难故障,依托服务器底层黑盒日志(如BMC日志、IPMI/SMBIOS数据、操作系统内核日志、硬件事件日志等)展开深度分析;协同内外部软硬件研发专家,实现疑难故障的精准根因定位;积极推动线上疑难故障自动化诊断分析能力建设,不断提高硬件故障监控诊断明确化率与报修维修一致率,有效降低故障返修率; 3、负责线上服务器监控相关Oncall问题的快速排查、精准定位与深度分析,及时为团队提供专业答疑;建立并完善硬件故障知识库,系统沉淀典型故障案例及高效排查方法论,助力团队整体技术能力提升。

更新于 2025-03-06