地平线NPU架构工程师

社招全职8年以上芯片序列2025-12-23地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1、硕士及以上相关专业学历，8年以上数字IC设计或架构设计背景，要求具有丰富的IP/SOC流片经验
2、有AI加速器/神经网络加速器设计实现的相关经验，有Tensor计算和Matrix计算加速器架构设计经…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

（以下一项或多项）：
1、与主架构师一起定义加速器架构，尤其是Tensor计算和Matrix计算加速器的架构
2、对计算加速器的PPA指标负责，对加速器的技术竞争力和业界领先性负责
3、对加速器进行架构建模，探索最优架构，做相应的算子性能分析和优化
4、与工具链编译器协同对加速器的可编程性和可部署性负责，提升编程开发的易用性，降低模型部署成本
5、参与规划定义关键场景，进行端到端的架构分析
6、参与AI处理器的PPA模型开发
7、参与竞争分析，输出技术方面的竞争分析结果。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

还有更多 •••

登录查看完整学习资料

相关职位

顶尖应届-NPU架构工程师-芯片

校招

1. 收集并分析典型端侧AI应用场景（如拍照录像、Agent、LLM等）的神经网络模型； 2. 选取典型端侧AI应用场景进行系统级软硬件联合验证； 3. 设计轻量化、高能效的NPU微架构，确定计算单元、控制单元、片上缓存等模块的整体架构方案； 4. 构建指令集及控制机制，支持灵活的操作控制与资源调度； 5. 设计多任务调度机制，支持边缘推理任务的优先级分配与资源共享。【课题名称】端侧高效推理NPU架构优化技术研究【课题内容】 1. 结合端侧设备的功耗、面积和实时性限制，探索轻量化、高能效的NPU微架构设计； 2. 针对常见深度学习算子（卷积、矩阵乘法、注意力机制等）进行硬件友好的重新设计与加速策略研究； 3. 优化片上存储结构（如SRAM/BRAM）以支持高效的数据调度和多任务并行处理； 4. 构建高效的DMA调度机制与片外内存访问控制策略，减少数据传输瓶颈； 5. 研究端侧NPU多任务协同下的推理调度策略，支持任务优先级、时间片切换等机制。

更新于 2025-06-26北京

高级AI芯片架构工程师（建模）

社招5年以上芯片

1. 负责自研NPU芯片的系统级、微架构级建模与仿真平台的设计与实现； 2. 主导NPU架构的性能、功耗、带宽等多维度建模分析，支持架构设计空间探索与优化； 3. 结合业务需求，建立高效、可扩展的建模工具链，推动软硬件协同设计； 4. 跟踪业界前沿建模技术，推动建模方法和工具的持续创新。

更新于 2025-06-16深圳|上海

NPU微架构工程师

社招5年以上智能与信息技术

职位描述： 1、理解NPU的设计Spec，完成NPU子系统的微架构设计； 2、进行NPU中重要模块比如指令队列、总线接口、DMA、线性单元等模块的设计； 3、支持验证团队和FPGA仿真团队的验证和仿真，配合验证完成覆盖率的分析与优化； 4、根据需求完成PPA优化； 5、配合FEint和PR工程师完成后端，协助后端团队解决时序和面积问题。

上海

高级芯片架构工程师

社招8-20年HARDWARE

1. 负责芯片N代平台AI全栈能力管理，统筹AI相关硬件、软件模块的整体管控工作，牵头对接伙伴团队，建立高效的跨团队协作机制，保障各项研发、落地工作无缝衔接、稳步推进。 2. 把控端侧AI功能落地质量，紧盯性能、功耗核心指标，牵头优化AI特性实施方案，攻克软硬件适配难题，确保端侧AI功能达成最优能效表现，实现产品体验与技术指标双达标。 3. 主导中长期平台技术规划，结合行业AI发展趋势与产品战略，科学规划N+1、N+2代芯片平台的AI技术路线，布局关键核心技术，保证平台技术储备贴合未来AI发展需求，筑牢技术竞争力。 4. 规划高价值技术预研项目，深度调研前沿AI技术与芯片研发方向，筛选、立项具备长期价值的预研课题，制定合理的研发推进计划，统筹调配研发资源，实现资源高效利用，避免无效投入。 5. 跟进AI领域技术迭代、竞品动态与行业需求，及时优化平台技术方案，解决AI研发及落地过程中的重难点问题，助力芯片产品持续保持技术领先性。

更新于 2026-04-07深圳|上海