
地平线【地瓜机器人】NPU性能优化工程师
社招全职5年以上芯片序列地点:北京 | 上海状态:招聘
任职要求
任职要求: 1. 计算机科学、电子工程、集成电路或相关领域的硕士或博士,至少5年以上相关领域的工作经验 2. 熟悉深度学习算法及其在硬件上的优化,有算子优化或性能建模经验 3. 熟悉NPU/GPU的架构以及微架构,具备芯片设计基础知识,了解芯片架构和性能优化方…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
岗位职责: 1. 研究分析模型算法和关键benchmark,分析算法需求,对模型在NPU上进行部署的性能进行评估和校准,为算法和NPU的协同优化提供数据和方案。 2. 对NPU架构及微架构进行建模,实现对NPU架构微架构的探索评估和优化,协同设计团队优化PPA,提升芯片的计算效率和能效比。 3. 针对多核大算力场景的特定需求,进行benchmark的性能分析和优化,确保benchmark性能的线性提升。 4. 通过开发API,脚本,自动化工具等方法进行性能评估的优化迭代,帮助提升开发效率 5. 与算法团队、硬件团队和工具链团队紧密合作,确保模型算法在NPU上的高效部署
包括英文材料
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
还有更多 •••
相关职位

社招5年以上芯片序列
岗位职责: 1. 承担系统/子系统/复杂模块的验证交付工作,搭建CT/BT环境。对现有系统验证方案进行综合评估,提出改进和优化; 2. 针对模块各种复杂应用场景,开发和实现不同验证组件,帮助设计人员高效定位和解决问题; 3. 根据编译器内核指令开发随机约束验证环境,撰写功能覆盖率文件,测试各种极端指令场景; 4. 与架构工程师紧密配合,运用各种技术全面分析芯片功耗/性能数据,优化芯片PPA技术指标; 5. 开发针对车规芯片FuSa (Functional Safety)功能的验证环境,并使用Z01X工具进行功能验证; 6. 引入和使用系统建模/ 静态仿真/ 原型验证等多种手段,延长验证生命周期,提高验证可信度; 7. 进一步规范系统验证流程,明确验证交付标准,全面提升验证与前后端技术人员的交互效率;
更新于 2025-10-20北京

社招5年以上芯片序列
1.分析业界AI算法、芯片技术的发展,研判友商演进趋势,推动NPU架构升级。 2.结合AI算法在AIoT、机器人领域的应用,探索NPU的算力、带宽、功耗、成本等最佳实现方式。 3.与算法、编译器、IP研发合作,输出NPU架构文档,对功能、性能、数据流、控制流进行明晰描述。 4.与开发部门合作,协同完成NPU的实现,并对PPA负责
更新于 2024-11-25北京

社招算法序列
负责机器人领域端侧大模型的研发和应用,研判大模型未来发展趋势为后续芯片NPU规划提供输入。主要工作方向包括: 1. 探索LLM、VLM、VLA大模型在端侧性能与精度极限 2. 跟进与判断大模型发展趋势为后续芯片NPU规划提供输入
更新于 2025-08-18北京