字节跳动服务器运维实习生-算力基础设施
任职要求
1、2026届本科及以上学历在读,理工科、计算机、电子信息工程、自动化等相关专业优先; 2、具有较强的沟通协调能力,善于思考和总结,具备良好的文档能力,有项目管理认证或经历优先; 3、责任心强,细致认真,对工作充满热情、富有团队精神;学习能力强,对新技术充满热情和好奇心,具有较强的解决问题、动手实践能力;具备较强的抗压抗干扰能力,能适应快节奏工作和丰富的工作任务; 4、具备较好的计算机编程基础,熟练掌握Python/Java/PHP/Perl/Go等常用计算机语言之一; 5、了解服务器、Linux系统相关知识,掌握Shell脚本。
工作职责
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、负责线上服务器稳定性保障服务,规划和建设稳定性流程规范、平台系统、保障机制和能力,负责现网运营稳定性监控、稳定性风险识别、问题响应处理和保障措施,保障业务稳定健康运行; 2、规划和建设路标、维保范围、SLO/SLA,驱动并协同配套流程建设和运营,面向业务提供整体服务交付; 3、运营技术支持能力建设和运营,服务器自维保运营适配,运维赋能建设和管理;运营数据及指标化建设和运营,过程分析和治理,运营技术、流程、工具系统优化; 4、自维保现场运维规范化标准化建设和运营,包含自维保现场运维流程规范、操作规范、运维技术规范等; 5、数据中心自维保现场管理和运营,包含自维保现场服务水平、服务质量、人效、赋能、过程管理和运营等;技术支持,包含复杂问题支持、共性问题、质量问题、风险隐患发掘、处理和驱动解决等; 6、服务器可维护性、易维护性标准建设、风险识别,标准化规范化管理和运营。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、负责服务器固件(BMC/BIOS)开发及验证; 2、负责服务器固件领域RAS、安全、性能、功耗、可观测等竞争力特性的策略制定、方案落地; 3、负责服务器、部件等领域技术发展趋势研究分析,结合业务场景及固件技术方向,开拓固件新方向并推动产品化落地。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、负责服务器固件(BMC/BIOS)开发及验证; 2、负责服务器固件领域RAS、安全、性能、功耗、可观测等竞争力特性的策略制定、方案落地; 3、负责服务器、部件等领域技术发展趋势研究分析,结合业务场景及固件技术方向,开拓固件新方向并推动产品化落地。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、负责服务器固件(BMC/BIOS)开发及验证; 2、负责服务器固件领域RAS、安全、性能、功耗、可观测等竞争力特性的策略制定、方案落地; 3、负责服务器、部件等领域技术发展趋势研究分析,结合业务场景及固件技术方向,开拓固件新方向并推动产品化落地。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、负责数据中心X86/ARM/GPU等多样性计算系统的性能评估与验证工作,提取与分析业务模型,制定针对性的评估方案,论证与优化服务器产品硬件架构设计的竞争力; 2、负责服务器硬件性能评估体系建,提升对芯片选型、缺陷识别、机型导入、TCO核算等业务的支撑能力,形成更符合字节跳动业务场景、架构设计合理、产品组合最优的落地表现; 3、参与服务器业务应用数据挖掘工作,提炼设计优化点,提升服务器在字节跳动业务场景落地的竞争力; 4、负责数据中心多样性计算的的系统测试设计、测试方案及测试执行,对异构硬件系统的功能、性能、可靠性验证质量负责; 5、跟进GPU服务器研发测试、生产测试及线上质量问题,结合研发、生产及现网质量问题,进行GPU故障预测,落地新测试场景、测试方法,推动GPU选型标准化、流程化; 6、跟进和探索CPU、GPU测试理论和测试方法,寻找合适的技术路径,支撑新技术的快速验证、形成评估结论,支撑新产品研发和产品化交付。