logo of xpeng

小鹏汽车AI多核架构师

社招全职5年以上地点:上海状态:招聘

任职要求


1.硬件能力
•计算机体系结构 / 微电子 / 通信硕士及以上,5 年以上 GPU / NPU / GPGPU多核架构经验;
•至少一次大算力芯片完整项目经验;
•熟悉并行编程模型(SIMT、SIMD、SPMD)、Cache Coherence、NoC、Chi…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.多核系统架构设计
•根据产品需求制定 Core × NoC × Cache × DRAM × Die-to-Die 总体架构;
•有能力设计调度,总线,多层Cache存储架构,同步硬件架构。
2.软硬件协同
•与 Compiler / Runtime / 框架团队沟通 Graph Compiler + Kernel Scheduler + 弹性分布式通信库,分解硬件架构需求;
•有能力根据 PyTorch / vLLM 等需求做端到端 Benchmark Sign-off。
包括英文材料
缓存+
还有更多 •••
相关职位

logo of xpeng
社招5年以上芯片板块

Die2Die/Chip2Chip 互联架构师 - 负责AI多核互连架构定义与方案设计 - 负责AI多芯片/多卡分布式计算互连架构定义与设计 - 主导过AI多核互连总线设计与性能交付 - 主导过 InfiniBand/RoCE/RDMA/PCIe/CXL/NVLink 等架构设计与高速互连方案落地 - 负责 AI 分布式集群互连架构设计:拓扑、带宽、时延、可靠性规划 - 跟踪前沿互连技术,输出预研与落地 roadmap

更新于 2026-03-03上海
logo of xpeng
社招3年以上

- 负责超大规模AI芯片中多核架构的设计,包括存储/互联/调度/同步/集成等 - 负责需求分解、微架构设计,撰写设计文档,相关IP的RTL开发与集成 - 协同各团队完成IP/多核系统的PPA优化 - 指导和支持中后端设计团队完成IP/多核系统的物理实现 - 支持芯片回片后的测试、性能/功耗调教等

更新于 2023-08-31深圳|上海
logo of horizon
社招软件序列

1、全栈AI系统架构设计 -主导AI软件栈(编译工具链、Runtime、编程模型、驱动)与硬件(ARM/GPU/NPU等)的协同设计,优化模型推理性能与能效。 -在芯片或产品架构定义阶段,将软件需求前置化,提出硬件可编程性、指令集扩展等关键设计建议。 2、技术规划与方案落地 -制定AI技术中长期路线图,评估新兴技术(如稀疏计算、量化编译、异构加速)在业务场景中的可行性。 -推动跨团队(算法、芯片、OS)协作,解决从模型到硬件的部署瓶颈(如算子适配、内存优化)。 3、算法-硬件协同优化 -结合模型结构(如Transformer/CNN)和目标硬件特性(ARM多核/向量指令集),设计定制化加速方案。 -参与前沿算法研究(如轻量化模型设计),确保其与底层硬件的高效匹配。 4、性能调优与工具链开发 -主导AI编译器(如MLIR、TVM)或Runtime的深度优化,提升跨平台部署效率。 -开发性能分析工具,定位系统级瓶颈(如DDR带宽、Cache命中率)。 。

更新于 2025-12-05上海|深圳
logo of liauto
社招5年以上智能与信息技术

负责设计和构建自研NPU编译器及工具链的核心架构;特别是跨模块接口设计、硬件抽象定义、编程模型设计、关键性能考量等方面。 1、编译器架构设计:聚焦于编译器(包含运行时)各模块间的接口设计。 硬件抽象定义:定义合理的NPU硬件抽象,在跨平台和发掘硬件效率之间找到最佳平衡。 2、开发者界面定义:定义编程模型和工具链界面,提升自定义算子开发和模型适配效能。 3、前沿技术研究:跟踪编译器技术(如MLIR、LLVM)、AI芯片架构及深度学习框架的最新进展,探索创新性解决方案。

上海