小鹏汽车AI多核架构师

社招全职5年以上2025-07-11地点：上海状态：招聘

扫码手机上打开

任职要求

1.硬件能力
•计算机体系结构 / 微电子 / 通信硕士及以上，5 年以上 GPU / NPU / GPGPU多核架构经验；
•至少一次大算力芯片完整项目经验；
•熟悉并行编程模型（SIMT、SIMD、SPMD）、Cache Coherence、NoC、Chi…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.多核系统架构设计
•根据产品需求制定 Core × NoC × Cache × DRAM × Die-to-Die 总体架构；
•有能力设计调度，总线，多层Cache存储架构，同步硬件架构。
2.软硬件协同
•与 Compiler / Runtime / 框架团队沟通 Graph Compiler + Kernel Scheduler + 弹性分布式通信库，分解硬件架构需求；
•有能力根据 PyTorch / vLLM 等需求做端到端 Benchmark Sign-off。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

缓存+

还有更多 •••

登录查看完整学习资料

相关职位

互联架构师

社招5年以上芯片板块

Die2Die/Chip2Chip 互联架构师 - 负责AI多核互连架构定义与方案设计 - 负责AI多芯片/多卡分布式计算互连架构定义与设计 - 主导过AI多核互连总线设计与性能交付 - 主导过 InfiniBand/RoCE/RDMA/PCIe/CXL/NVLink 等架构设计与高速互连方案落地 - 负责 AI 分布式集群互连架构设计：拓扑、带宽、时延、可靠性规划 - 跟踪前沿互连技术，输出预研与落地 roadmap

更新于 2026-03-03上海

IP设计工程师（多核系统）

社招3年以上

- 负责超大规模AI芯片中多核架构的设计，包括存储/互联/调度/同步/集成等 - 负责需求分解、微架构设计，撰写设计文档，相关IP的RTL开发与集成 - 协同各团队完成IP/多核系统的PPA优化 - 指导和支持中后端设计团队完成IP/多核系统的物理实现 - 支持芯片回片后的测试、性能/功耗调教等

更新于 2023-08-31深圳|上海

AI 软件系统架构师

社招软件序列

1、全栈AI系统架构设计 -主导AI软件栈（编译工具链、Runtime、编程模型、驱动）与硬件（ARM/GPU/NPU等）的协同设计，优化模型推理性能与能效。 -在芯片或产品架构定义阶段，将软件需求前置化，提出硬件可编程性、指令集扩展等关键设计建议。 2、技术规划与方案落地 -制定AI技术中长期路线图，评估新兴技术（如稀疏计算、量化编译、异构加速）在业务场景中的可行性。 -推动跨团队（算法、芯片、OS）协作，解决从模型到硬件的部署瓶颈（如算子适配、内存优化）。 3、算法-硬件协同优化 -结合模型结构（如Transformer/CNN）和目标硬件特性（ARM多核/向量指令集），设计定制化加速方案。 -参与前沿算法研究（如轻量化模型设计），确保其与底层硬件的高效匹配。 4、性能调优与工具链开发 -主导AI编译器（如MLIR、TVM）或Runtime的深度优化，提升跨平台部署效率。 -开发性能分析工具，定位系统级瓶颈（如DDR带宽、Cache命中率）。。

更新于 2025-12-05上海|深圳

NPU编译器架构师

社招5年以上智能与信息技术

负责设计和构建自研NPU编译器及工具链的核心架构；特别是跨模块接口设计、硬件抽象定义、编程模型设计、关键性能考量等方面。 1、编译器架构设计：聚焦于编译器（包含运行时）各模块间的接口设计。硬件抽象定义：定义合理的NPU硬件抽象，在跨平台和发掘硬件效率之间找到最佳平衡。 2、开发者界面定义：定义编程模型和工具链界面，提升自定义算子开发和模型适配效能。 3、前沿技术研究：跟踪编译器技术（如MLIR、LLVM）、AI芯片架构及深度学习框架的最新进展，探索创新性解决方案。

上海