字节跳动系统软件工程师-算力数据中心与供应链
任职要求
1、2026届获得本科及以上学历,计算机科学、电子工程、软件工程等相关专业; 2、掌握C/C++/Golang等编程语言,了解汇编语言基础,具备良好的代码风格; 3、了解X86/ARM/RISC-V架构基础知识,对BIOS/BMC、Linux内核及操作系统有一定了解…
工作职责
团队介绍:字节跳动数据中心与供应链部门,负责字节跳动从芯片到服务器全栈算力基础设施的研发、调度与供给、管理与应用(如数据中心建设、内核操作系统、网络CDN、高性能服务器、编译工具链等),支撑字节跳动全系业务运行的核心力量,为抖音、今日头条、飞书、火山引擎等各类产品提供全面、领先、稳定的百万量级大规模算力基础设施服务。 1、系统软件开发:参与BIOS、BMC固件、Linux内核及操作系统相关模块的开发,解决底层硬件兼容性以及功能扩展问题,实现软硬件一体化集成; 2、系统优化与维护:对BIOS、BMC固件、Linux内核及操作系统进行性能测试、分析、优化,定位并解决系统运行过程中的各类问题,保障系统高效稳定运行; 3、系统监控诊断:设计与实现系统监控诊断相关功能,开发监控工具或模块,实时监测BIOS、BMC固件、Linux内核及操作系统的运行状态,及时发现并预警潜在故障,协助排查和解决系统故障; 4、新技术探索与应用:关注系统软件领域最新技术动态,如人工智能在系统诊断中的应用、系统技术在AI基础设施中的应用等,结合公司业务需求,探索新技术在项目中的可行性,提出创新方案并实践验证。
团队介绍:字节跳动数据中心与供应链部门,负责字节跳动从芯片到服务器全栈算力基础设施的研发、调度与供给、管理与应用(如数据中心建设、内核操作系统、网络CDN、高性能服务器、编译工具链等),支撑字节跳动全系业务运行的核心力量,为抖音、今日头条、飞书、火山引擎等各类产品提供全面、领先、稳定的百万量级大规模算力基础设施服务。 1、负责字节跳动百万级主机运维平台、监控平台、安全平台等系统的设计和研发提升运维效率和变更安全性,构建运维平台; 2、负责数据中心基础系统服务的研发和运维,包括DNS、NTP、DHCP、装机、镜像站等,持续优化和提升服务性能,保障服务稳定性; 3、负责系统关键技术难题的攻坚解决,并根据业务发展需要对相关技术进行前瞻性调研。
团队介绍:字节跳动云基础设施部门,通过云技术管理着百万量级的服务器构成的超大数据中心。我们通过深度优化千万级容器实例与算力优化,搭建EB级数据存储治理体系,探索新一代搜索型数据库与大规模AI集群下的高速网络通信,我们积极拥抱开源和创新的软硬件架构,致力于构建业界领先、稳定、高可用的面向LLM的AI云原生的基础设施架构与产品矩阵,为整个公司的业务和客户发展保驾护航。 1、参与字节跳动计算、存储、网络、云原生、基础技术、平台架构、字节云等基础设施和云基础产品的构建和优化; 2、参与基础设施和云基础产品的可用性、稳定性保障。
1、售前工作:重点负责大规模智算中心项目的需求分析、整体规划、方案设计、招投标等工作,协同内部部门与外部生态伙伴等资源,在方案规划、售前、交付等关键里程碑节点联合攻坚,保障项目成功; 2、解决方案:作为智算领域的技术专家,与客户紧密合作,深入了解其业务需求和技术挑战,提供客户从智算算力、数据、大模型等内容的整体规划到实施落地全过程技术交流及解决方案,并在落地过程中提供对内外部团队提供必要的技术指导,确保方案可落地、有竞争力。协助客户方案比选,通过POC演示和功能、性能测试验证技术优势;; 3、行业识别:负责支持市场洞察、竞争分析、行业打法策略分析与制定,支撑智算行业机会点识别、行业整体业务规划和策略落地; 4、外部影响:负责开展面向政府、实验室、运营商、算力合作单位、生态合作伙伴的培训与市场宣贯活动。
1、售前工作:负责区域央国企、区域企业等行业项目的需求、规划、方案、招投标等工作,协同内部部门与外部生态伙伴等资源,在方案规划、售前、交付等关键里程碑节点联合攻坚,保障项目成功; 2、解决方案:作为技术专家,与客户紧密合作,深入了解其业务需求和技术挑战,提供客户智算中心、大模型、云平台等从规划到实施落地全过程技术交流及解决方案,并在落地过程中提供对内外部团队提供必要的技术指导,确保方案可落地、有竞争力。协助客户方案比选,通过POC演示和功能、性能测试验证技术优势; 3、行业识别:负责支持区域市场洞察、竞争分析、行业打法策略分析与制定,支撑行业机会点识别、行业整体业务规划和策略落地,行业包括但不限于烟草、文化传媒、工业制造、集成电路、信息服务、商贸流通等; 4、外部影响:负责开展面向企业、合作伙伴的培训与市场宣贯活动。