字节跳动SOC能效优化研究实习生-移动OS-筋斗云人才计划
任职要求
1、2026届及之后毕业,博士在读,人工智能、计算机架构与系统相关专业优先;
2、优秀的代码能力、熟悉微架构领域的基础知识和性能分析方法,扎实的机器学习基础;
3、熟悉Linux内核,并在开源社区承担…工作职责
团队介绍:专注于探索AI和智能硬件的结合,为用户提供更自然和便捷的交互体验的研发团队,隶属于产品研发与工程架构部。作为负责AI技术应用场景探索的部门,是字节在智能硬件领域提供综合方案研究的核心部门。我们欢迎期待心怀技术理想、不断挑战技术难题的“你”的加入,和顶尖团队一起参与技术攻坚,开启更多可能。 课题介绍: 背景:目前移动端处理器均是非对称异构多核处理器(big.LITTLE架构),之前的调度器(类)大多基于Linux原生的公平调度算法CFS/EEVDF。自EAS引入后,才使调度器第一次具备了能耗感知能力,通过EM(能耗模型)来量化调度行为导致的CPU能耗变化,从而做出能耗更优的大小核调度。但随着应用生态的日益多样和CPU算力的快速升级,EAS也暴露了自身的设计不足,如: 1、EM模型参数需要通过实验室数据模拟设定,设定后无法修改; 2、不能针对不同的场景做精细化的预估和调节; 3、功耗模型应用时未考虑任务自身的的指令执行效率和特征分类,从而做出一些不恰当的选择等; 4、为了充分发挥异构多核处理器的能效优势,精准计算和指导SoC的能效优化,迫切需要结合异构硬件特性实现对CPU指令吞吐性能感知和能效动态预估,打造一个面向AI新生态和能效智能校准能力的调度器; 5、进一步的,通过对异构计算能力的指令级能耗分解,并结合未来的芯片技术发展趋势,可以实现范围更广的多算力设备联合调度和能效建模,从软硬结合的角度构造核心竞争力,将SoC能效优化推到极致。 课题挑战: 1、开销:系统中需要实时监控和统计指令特征等信息,引入的开销需要控制在最小的范围内; 2、硬件制约:部分平台,对外提供的AMU/PMU事件较少,寄存器数量有限,可能要做分时复用设计;异构多核系统以及cache的多级设定,对指令的执行效率和产生的能效有较大扰动,需要结合架构做灰盒建模; 3、复合场景:多窗口,多应用,悬浮窗等不同场景下,能耗模型的普适性和准确性; 4、复合场景:多窗口,多应用,悬浮窗等不同场景下,能耗模型的普适性和准确性。 目标: 1、游戏、动效等场景,帧率不变,功耗优化10%。
团队介绍:专注于探索AI和智能硬件的结合,为用户提供更自然和便捷的交互体验的研发团队,隶属于产品研发与工程架构部。作为负责AI技术应用场景探索的部门,是字节在智能硬件领域提供综合方案研究的核心部门。我们欢迎期待心怀技术理想、不断挑战技术难题的“你”的加入,和顶尖团队一起参与技术攻坚,开启更多可能。 课题介绍: 背景:目前移动端处理器均是非对称异构多核处理器(big.LITTLE架构),之前的调度器(类)大多基于Linux原生的公平调度算法CFS/EEVDF。自EAS引入后,才使调度器第一次具备了能耗感知能力,通过EM(能耗模型)来量化调度行为导致的CPU能耗变化,从而做出能耗更优的大小核调度。但随着应用生态的日益多样和CPU算力的快速升级,EAS也暴露了自身的设计不足,如: 1、EM模型参数需要通过实验室数据模拟设定,设定后无法修改; 2、不能针对不同的场景做精细化的预估和调节; 3、功耗模型应用时未考虑任务自身的的指令执行效率和特征分类,从而做出一些不恰当的选择等; 4、为了充分发挥异构多核处理器的能效优势,精准计算和指导SoC的能效优化,迫切需要结合异构硬件特性实现对CPU指令吞吐性能感知和能效动态预估,打造一个面向AI新生态和能效智能校准能力的调度器; 5、进一步的,通过对异构计算能力的指令级能耗分解,并结合未来的芯片技术发展趋势,可以实现范围更广的多算力设备联合调度和能效建模,从软硬结合的角度构造核心竞争力,将SoC能效优化推到极致。 课题挑战: 1、开销:系统中需要实时监控和统计指令特征等信息,引入的开销需要控制在最小的范围内; 2、硬件制约:部分平台,对外提供的AMU/PMU事件较少,寄存器数量有限,可能要做分时复用设计;异构多核系统以及cache的多级设定,对指令的执行效率和产生的能效有较大扰动,需要结合架构做灰盒建模; 3、复合场景:多窗口,多应用,悬浮窗等不同场景下,能耗模型的普适性和准确性。 目标: 1、游戏、动效等场景,帧率不变,功耗优化10%。
团队介绍:专注于探索AI和智能硬件的结合,为用户提供更自然和便捷的交互体验的研发团队,隶属于产品研发与工程架构部。作为负责AI技术应用场景探索的部门,是字节在智能硬件领域提供综合方案研究的核心部门。我们欢迎期待心怀技术理想、不断挑战技术难题的“你”的加入,和顶尖团队一起参与技术攻坚,开启更多可能。 课题介绍: 背景:目前移动端处理器均是非对称异构多核处理器(big.LITTLE架构),之前的调度器(类)大多基于Linux原生的公平调度算法CFS/EEVDF。自EAS引入后,才使调度器第一次具备了能耗感知能力,通过EM(能耗模型)来量化调度行为导致的CPU能耗变化,从而做出能耗更优的大小核调度。但随着应用生态的日益多样和CPU算力的快速升级,EAS也暴露了自身的设计不足,如: 1、EM模型参数需要通过实验室数据模拟设定,设定后无法修改; 2、不能针对不同的场景做精细化的预估和调节; 3、功耗模型应用时未考虑任务自身的的指令执行效率和特征分类,从而做出一些不恰当的选择等; 4、为了充分发挥异构多核处理器的能效优势,精准计算和指导SoC的能效优化,迫切需要结合异构硬件特性实现对CPU指令吞吐性能感知和能效动态预估,打造一个面向AI新生态和能效智能校准能力的调度器; 5、进一步的,通过对异构计算能力的指令级能耗分解,并结合未来的芯片技术发展趋势,可以实现范围更广的多算力设备联合调度和能效建模,从软硬结合的角度构造核心竞争力,将SoC能效优化推到极致。 课题挑战: 1、开销:系统中需要实时监控和统计指令特征等信息,引入的开销需要控制在最小的范围内; 2、硬件制约:部分平台,对外提供的AMU/PMU事件较少,寄存器数量有限,可能要做分时复用设计;异构多核系统以及cache的多级设定,对指令的执行效率和产生的能效有较大扰动,需要结合架构做灰盒建模; 3、复合场景:多窗口,多应用,悬浮窗等不同场景下,能耗模型的普适性和准确性。 目标: 1、游戏、动效等场景,帧率不变,功耗优化10%。
岗位职责(以下一项或多项): 1、负责在Android和iOS平台上用户典型业务应用场景的系统性能能效分析,以及自研芯片平台用户场景的性能功耗分析和优化; 2、对业界标杆竞品平台性能能效相关的前沿技术研究、专利技术挖掘,包括软硬件协同方案设计和收益分析等; 3、深入理解用户体验产品需求,构建性能能效分析工具链和大数据平台,利用大数据充分挖掘用户隐藏痛点(续航/游戏/应用体验),提炼产品设计需求,持续构建提升产品的行业竞争力; 4、构建用户体验续航指标和能效评估模型,识别关键影响因子,牵引芯片设计和产品宣传方向; 5、负责SoC系统性能和功耗优化工作。
1. 收集并分析典型端侧AI应用场景(如拍照录像、Agent、LLM等)的神经网络模型; 2. 选取典型端侧AI应用场景进行系统级软硬件联合验证; 3. 设计轻量化、高能效的NPU微架构,确定计算单元、控制单元、片上缓存等模块的整体架构方案; 4. 构建指令集及控制机制,支持灵活的操作控制与资源调度; 5. 设计多任务调度机制,支持边缘推理任务的优先级分配与资源共享。 【课题名称】 端侧高效推理NPU架构优化技术研究 【课题内容】 1. 结合端侧设备的功耗、面积和实时性限制,探索轻量化、高能效的NPU微架构设计; 2. 针对常见深度学习算子(卷积、矩阵乘法、注意力机制等)进行硬件友好的重新设计与加速策略研究; 3. 优化片上存储结构(如SRAM/BRAM)以支持高效的数据调度和多任务并行处理; 4. 构建高效的DMA调度机制与片外内存访问控制策略,减少数据传输瓶颈; 5. 研究端侧NPU多任务协同下的推理调度策略,支持任务优先级、时间片切换等机制。