字节跳动服务器运维实习生-算力基础设施
任职要求
1、2026届本科及以上学历在读,理工科、计算机、电子信息工程、自动化等相关专业优先;
2、具有较强的沟通协调能力,善于思考和总结,具备良好的文档能力,有项目管理认证或经历优先;
3、责任心强,细致认真,对工作充满热情、富有团队精神;学习能力强,对新技术充满热情和好奇…工作职责
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、负责线上服务器稳定性保障服务,规划和建设稳定性流程规范、平台系统、保障机制和能力,负责现网运营稳定性监控、稳定性风险识别、问题响应处理和保障措施,保障业务稳定健康运行; 2、规划和建设路标、维保范围、SLO/SLA,驱动并协同配套流程建设和运营,面向业务提供整体服务交付; 3、运营技术支持能力建设和运营,服务器自维保运营适配,运维赋能建设和管理;运营数据及指标化建设和运营,过程分析和治理,运营技术、流程、工具系统优化; 4、自维保现场运维规范化标准化建设和运营,包含自维保现场运维流程规范、操作规范、运维技术规范等; 5、数据中心自维保现场管理和运营,包含自维保现场服务水平、服务质量、人效、赋能、过程管理和运营等;技术支持,包含复杂问题支持、共性问题、质量问题、风险隐患发掘、处理和驱动解决等; 6、服务器可维护性、易维护性标准建设、风险识别,标准化规范化管理和运营。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、系统工具开发和整合,系统平台开发; 2、对现有的平台和工具,业务的瓶颈进行优化和重构; 3、基于海量数据进行分析,建模和预测; 4、系统新技术的调研和孵化。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、系统工具开发和整合,系统平台开发; 2、对现有的平台和工具,业务的瓶颈进行优化和重构; 3、基于海量数据进行分析,建模和预测; 4、系统新技术的调研和孵化。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、负责超大规模的主机系统运维&监控中心,运维中心涵盖变更发布、服务托管、配置采集,监控中心涵盖采集、存储、告警等基础能力; 2、参与产品需求设计、研发方案设计及代码开发等,编写和维护相关平台的技术文档; 3、参与海量Agent、中心调度、数据存储等关键技术的研发和优化; 4、根据业界相关技术的发展做前瞻性调研、预研工作。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动系统部,负责字节跳动从芯片到服务器、操作系统、网络、CDN 、数据中心等基础设施的研发、设计、采购、交付与运营管理,为包含抖音、头条、火山引擎等全球业务提供高效、稳定、具备可扩展性的基础设施。部门当前业务开展包括不限于:数据中心设计建设、芯片研发、服务器研发、网络工程研发、火山引擎边缘云业务、高性能智能硬件研发、IDC资源智能交付与运维、硬件基础设施智能监控与预警、操作系统与内核、虚拟化技术、编译工具链、供应链管理等众多基础设施相关方向。 1、负责数据中心X86/ARM/GPU等多样性计算系统的性能评估与验证工作,提取与分析业务模型,制定针对性的评估方案,论证与优化服务器产品硬件架构设计的竞争力; 2、负责服务器硬件性能评估体系建,提升对芯片选型、缺陷识别、机型导入、TCO核算等业务的支撑能力,形成更符合字节跳动业务场景、架构设计合理、产品组合最优的落地表现; 3、参与服务器业务应用数据挖掘工作,提炼设计优化点,提升服务器在字节跳动业务场景落地的竞争力; 4、负责数据中心多样性计算的的系统测试设计、测试方案及测试执行,对异构硬件系统的功能、性能、可靠性验证质量负责; 5、跟进GPU服务器研发测试、生产测试及线上质量问题,结合研发、生产及现网质量问题,进行GPU故障预测,落地新测试场景、测试方法,推动GPU选型标准化、流程化; 6、跟进和探索CPU、GPU测试理论和测试方法,寻找合适的技术路径,支撑新技术的快速验证、形成评估结论,支撑新产品研发和产品化交付。