logo of dji

大疆资深NPU架构设计专家

社招全职硬件地点:深圳 | 上海状态:招聘

任职要求


1. 具备丰富的NPU架构设和实现经验,深入理解高性能计算、高吞吐量流水线设计及优化,对异构计算和并行计算有深入理解;
2. 在与业界先进NPU对比仍具有较强竞争力的NPU方案团队中作为关键人参与过核心架构方案设计或者担任过重要角色;
3. 具有NPU功耗建模和分析以及芯片低功耗设计经验,熟练掌握芯片设计基本的低功耗设计技术,深入理解数据复用、低精度量化、稀疏计算、DVFS等技术在功耗优化中的应用;
4. 具有软硬件联合设计经验和视角,理解算法、软件及编译策略等与硬件联合设计的重要性,以及联合优化的常用手段以及系统性能提升的方法路径。

工作职责


1. 通过技术调研和竞品分析,完成有竞争力的NPU架构定义和设计;确保所设计的架构在业务支持性、高性能、高面效、低功耗、高能效等关键评价指标的竞争力;
2. 深入分析DJI大疆业务网络模型需求以及业界广泛使用的经典算法及网络结构,确保架构设计能够高效支持多样化NN工作负载;
3. 制定详细的NPU规格架构,包括指令集及调度控制链路设计、关键计算资源设计、数据路径设计、存储体系结构等,解决设计及实现过程中的关键问题,确保NPU系统的功能和性能达成;
4. 与网络算法团队,NPU IP设计、软件开发和编译器团队高效协同;
5. 对NPU进行功耗分析与建模,运用功耗优化工具识别能效优化关键点,以芯片低功耗技术为基础手段,协同算法软件团队,通过算法调整和编译优化,实现软件层的功耗降低,确保整体系统在各类运行场景下的能效最大化。
包括英文材料
算法+
相关职位

logo of dji
社招3年以上芯片

1. 负责芯片的需求分析、规格定义及架构设计,进行性能等指标分解,确保芯片满足PPA目标; 2. 带领团队进行芯片性能分析,识别性能瓶颈并给出架构/设计优化方案,推动优化落地; 3. 芯片回片后,跟进设计及性能指标测试及闭环,指导下一代芯片设计优化; 4. 与软件团队进行软硬件联合优化,支持软件进行芯片性能调优,确保芯片在产品中发挥性能潜力; 5. 持续对标SOC芯片架构及性能优化领域先进技术,制定技术路线图,主导架构设计前沿技术预研及落地。

更新于 2025-01-03
logo of kuaishou
社招5年以上D8039

1.负责AI平台架构设计和AI工程化技术实现; 2.通过AI基础设施和软硬件协同优化来提升公司AI模型训练和推理的效率; 3. 负责云侧或端侧大模型和小模型推理服务开发、性能优化、上线部署等工作。

更新于 2025-04-01
logo of didi
社招技术

1. 主导大模型推理引擎的架构设计与核心模块开发,支撑千亿参数模型的高效分布式推理。 2. 研发面向GPU/NPU等异构计算平台的高性能算子,提升硬件利用效率。 3. 参与模型低精度量化,图优化,编译优化等性能优化工作。 4. 攻克分布式推理中的动态负载均衡、通信优化、显存管理等核心技术难题。 5. 跟踪学术界与工业界前沿技术(如vLLM、TGI、TensorRT-LLM等),推进框架迭代。

更新于 2025-08-05
logo of transsion
社招

参与语音、图像、大模型等算法的工程化架构设计、程序实现和优化; 解决算法在落地应用过程中发现的问题; 指导和带领初级工程师,提升团队整体技术水平。

更新于 2025-02-22