logo of nio

蔚来AI处理器建模工程师

社招全职3-5年芯片研发地点:上海 | 合肥状态:招聘

任职要求


1、本科及以上学历,计算机/电子工程/自动化等相关专业;
2、有两年以上工作经验,一年以上建模经验,熟悉计算机系统架构,熟悉CPU、GPU、NPU等(其中之一)计算核心的架构;
3、较强的软件编程能力(C/C++Python), 拥有SystemC、TLM 背景知识优先;
4、了解RISC-V/PTX指令集,熟悉GPU/CPU/NPU性能分析优先;
5、具有良好团队协作精神,责任心强,能够积极主动完成任务;

工作职责


1、根据芯片架构演进,负责开发功能模型和时序精确仿真模型,给出微架构的特性分析与评估;
2、针对具体AI处理器,搭建验证环境,构造性能测试集(包括指令级,kernel级以及benchmark网络级)分析硬件架构瓶颈,根据模型仿真结果分析影响系统性能的关键点并给出优化思路;
3、协同芯片设计验证团队进行RTL 性能分析和验证,定位瓶颈,给出优化思路;
4、配合芯片架构师,完成架构层级建模和验证;
包括英文材料
学历+
C+
C+++
Python+
RISC-V+
相关职位

logo of baidu
社招ACG

-参与AI通用处理器各种抽象层级的建模,包括但不限于(功能/性能/功耗)建模 -支持各种性能分析/功耗分析工具开发,并参与性能/功耗分析 -与硬件团队合作,进行功能/性能/功耗验证 -与软件/编译器团队合作,进行系统软硬件协同优化

更新于 2025-06-20
logo of bytedance
社招5年以上A177181

1、负责设计AI芯片仿真系统框架,在事务级和CA层级; 2、设计集群建模方案,考虑仿真集群的虚拟化,提供用户友好的部署接口; 3、深入优化仿真系统执行效率。

更新于 2025-01-26
logo of bytedance
社招5年以上A135793A

1、负责设计AI芯片仿真系统框架,在事务级和CA层级; 2、设计集群建模方案,考虑仿真集群的虚拟化,提供用户友好的部署接口; 3、深入优化仿真系统执行效率。

更新于 2025-04-25
logo of bytedance
社招A161520

团队介绍:专注于探索AI和智能硬件的结合,为用户提供更自然和便捷的交互体验的研发团队,隶属于产品研发与工程架构部。作为负责AI技术应用场景探索的部门,是字节在智能硬件领域提供综合方案研究的核心部门。我们欢迎期待心怀技术理想、不断挑战技术难题的“你”的加入,和顶尖团队一起参与技术攻坚,开启更多可能。 课题介绍: 背景:目前移动端处理器均是非对称异构多核处理器(big.LITTLE架构),之前的调度器(类)大多基于Linux原生的公平调度算法CFS/EEVDF。自EAS引入后,才使调度器第一次具备了能耗感知能力,通过EM(能耗模型)来量化调度行为导致的CPU能耗变化,从而做出能耗更优的大小核调度。但随着应用生态的日益多样和CPU算力的快速升级,EAS也暴露了自身的设计不足,如: 1、EM模型参数需要通过实验室数据模拟设定,设定后无法修改; 2、不能针对不同的场景做精细化的预估和调节; 3、功耗模型应用时未考虑任务自身的的指令执行效率和特征分类,从而做出一些不恰当的选择等; 4、为了充分发挥异构多核处理器的能效优势,精准计算和指导SoC的能效优化,迫切需要结合异构硬件特性实现对CPU指令吞吐性能感知和能效动态预估,打造一个面向AI新生态和能效智能校准能力的调度器; 5、进一步的,通过对异构计算能力的指令级能耗分解,并结合未来的芯片技术发展趋势,可以实现范围更广的多算力设备联合调度和能效建模,从软硬结合的角度构造核心竞争力,将SoC能效优化推到极致。 课题挑战: 1、开销:系统中需要实时监控和统计指令特征等信息,引入的开销需要控制在最小的范围内; 2、硬件制约:部分平台,对外提供的AMU/PMU事件较少,寄存器数量有限,可能要做分时复用设计;异构多核系统以及cache的多级设定,对指令的执行效率和产生的能效有较大扰动,需要结合架构做灰盒建模; 3、复合场景:多窗口,多应用,悬浮窗等不同场景下,能耗模型的普适性和准确性。 目标: 1、游戏、动效等场景,帧率不变,功耗优化10%。

更新于 2025-05-13