小米顶尖应届-处理器性能工程师-芯片
任职要求
1、计算机体系结构/电子工程/微电子相关专业硕士及以上学历;
2、熟练掌握性能分析、建模及设计空间探索方法论,具备RTL到系统级联合仿真的实战经验;
3、精通Gem5、SystemC或类似建模工具的深度定制,主导过完整CPU/GPU建模或相关性能分析项目者优先。
4、在体系结构,指令级并行 、内存一致性模型 、异构计算等领域有创新性论文或专利成果。
工作职责
1.通过分析LMbench/GKB/SpecCPU等benchmark,提取手机/车/等DOU场景典型切片,形成一套适用于EDA和原型平台的性能验证的切片方法学; 2.建立性能模型和EDA/EMU平台归一化的Top down性能度量指标,用于快速性能分析和定位, 探索适合复杂CPU的性能分析方法学; 3.建立基于EDA的Top性能验证平台,通过短切片实现EDA层面的快速性能迭代和校准,通过EDA仿真在RTL开发阶段发现各类性能瓶颈,不断推动CPU微架构调优; 4.建立基于EMU原型的性能验证平台,通过典型切片和Cycle accurate Performance model校准性能,基于Top down的指标实现快速迭代。
1、参与或主导Vector/Matrix单元微架构和算子设计,并进行性能、功耗论证; 2、参与或主导Vector/Matrix单元RTL实现与调优; 【课题名称】 通用处理器Vector及Matrix计算单元微架构及算法研究。 【课题内容】 背景:随着AI芯片在深度学习领域的爆发式应用,专用加速器在特定场景下展现出显著优势。然而通用处理器作为计算生态的核心底座,仍需在混合计算负载支持、能效比优化及异构协同能力等维度持续突破: 1. AI规模化部署需求:边缘计算、云边端协同等场景要求通用处理器高效处理AI预处理、逻辑控制与非结构化任务; 2. 摩尔定律放缓倒逼创新:在制程红利递减背景下,需通过微架构革新提升单位晶体管效能; 3. 异构计算融合趋势:通用处理器需与AI加速器深度协同,构建"CPU+XPU"的动态计算网络; 关键挑战: 1. 通用性与效率的平衡 如何在支持多样化指令集的同时,保持对AI算子(如矩阵乘、张量计算)的高效加速; 2. 动态资源调度复杂性 多任务场景下的缓存一致性、乱序执行、分支预测等机制需重构优化; 3. 异构计算通信瓶颈 跨架构内存共享、任务分配策略、低延迟互连协议设计; 4. 能效比突破困境 在先进制程逼近物理极限时,如何通过近似计算、存算一体等架构创新实现能效跃升;
基于自研芯片、HyperOS技术基座,构建从系统到芯片的系统级优化,提升用户流畅体验。 1. 基于CPU架构的优化,如,片内加速器架构、指令预取、指令推测并行处理技术实现性能提升; 2. 探索业界新型操作系统、新型SOC架构,专项预研,孵化落地产品。 【课题名称】 HyperOS系统软硬协同优化研究 【课题内容】 操作系统软硬协同优化
1、依据业务识别出来的关键场景,与操作系统框架层联合设计、开发、交付增供给、省开销系统性方案,负责内核相关的任务调度、内存管理、文件系统特性开发; 2、洞察linux业界关键演进,通过与操作系统框架层联合演进,进行预研并落地下一代产品。 【课题名称】 Android基于处理器微架构与软件指令流建模的软件架构优化。 【课题内容】 对于硬件多线程多标量乱序处理器来说,如何能够提高处理器流水线的利用率,已经成当前的整机能效问题的重要方向。按照Tick & Tock规律,每年芯片的绝对峰值性能只有5%~10%的提升,然而绝大部分操作系统程序执行的IPC(Instruction Per Cycle),占芯片峰值吞吐率的20%左右。 我们的课题聚焦:优化软件架构,提升芯片IPC吞吐率,提升整机性能。