小鹏汽车AI多核架构师
任职要求
1.硬件能力
•计算机体系结构 / 微电子 / 通信硕士及以上,5 年以上 GPU / NPU / GPGPU多核架构经验;
•至少一次大算力芯片完整项目经验;
•熟悉并行编程模型(SIMT、SIMD、SPMD)、Cache Coherence、NoC、Chi…工作职责
1.多核系统架构设计 •根据产品需求制定 Core × NoC × Cache × DRAM × Die-to-Die 总体架构; •有能力设计调度,总线,多层Cache存储架构,同步硬件架构。 2.软硬件协同 •与 Compiler / Runtime / 框架团队沟通 Graph Compiler + Kernel Scheduler + 弹性分布式通信库,分解硬件架构需求; •有能力根据 PyTorch / vLLM 等需求做端到端 Benchmark Sign-off。
Die2Die/Chip2Chip 互联架构师 - 负责AI多核互连架构定义与方案设计 - 负责AI多芯片/多卡分布式计算互连架构定义与设计 - 主导过AI多核互连总线设计与性能交付 - 主导过 InfiniBand/RoCE/RDMA/PCIe/CXL/NVLink 等架构设计与高速互连方案落地 - 负责 AI 分布式集群互连架构设计:拓扑、带宽、时延、可靠性规划 - 跟踪前沿互连技术,输出预研与落地 roadmap
- 负责超大规模AI芯片中多核架构的设计,包括存储/互联/调度/同步/集成等 - 负责需求分解、微架构设计,撰写设计文档,相关IP的RTL开发与集成 - 协同各团队完成IP/多核系统的PPA优化 - 指导和支持中后端设计团队完成IP/多核系统的物理实现 - 支持芯片回片后的测试、性能/功耗调教等

1、全栈AI系统架构设计 -主导AI软件栈(编译工具链、Runtime、编程模型、驱动)与硬件(ARM/GPU/NPU等)的协同设计,优化模型推理性能与能效。 -在芯片或产品架构定义阶段,将软件需求前置化,提出硬件可编程性、指令集扩展等关键设计建议。 2、技术规划与方案落地 -制定AI技术中长期路线图,评估新兴技术(如稀疏计算、量化编译、异构加速)在业务场景中的可行性。 -推动跨团队(算法、芯片、OS)协作,解决从模型到硬件的部署瓶颈(如算子适配、内存优化)。 3、算法-硬件协同优化 -结合模型结构(如Transformer/CNN)和目标硬件特性(ARM多核/向量指令集),设计定制化加速方案。 -参与前沿算法研究(如轻量化模型设计),确保其与底层硬件的高效匹配。 4、性能调优与工具链开发 -主导AI编译器(如MLIR、TVM)或Runtime的深度优化,提升跨平台部署效率。 -开发性能分析工具,定位系统级瓶颈(如DDR带宽、Cache命中率)。 。