logo of dji

大疆资深NPU架构设计专家

社招全职硬件地点:深圳 | 上海状态:招聘

任职要求


1. 具备丰富的NPU架构设和实现经验,深入理解高性能计算、高吞吐量流水线设计及优化,对异构计算和并行计算有深入理解;
2. 在与业界先进NPU对比仍具有较强竞争力的NPU方案团队中作为关键人参与过核心架构方案设计或者担任过重要角色;
3. 具有NPU功耗建模和分析以及…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 通过技术调研和竞品分析,完成有竞争力的NPU架构定义和设计;确保所设计的架构在业务支持性、高性能、高面效、低功耗、高能效等关键评价指标的竞争力;
2. 深入分析DJI大疆业务网络模型需求以及业界广泛使用的经典算法及网络结构,确保架构设计能够高效支持多样化NN工作负载;
3. 制定详细的NPU规格架构,包括指令集及调度控制链路设计、关键计算资源设计、数据路径设计、存储体系结构等,解决设计及实现过程中的关键问题,确保NPU系统的功能和性能达成;
4. 与网络算法团队,NPU IP设计、软件开发和编译器团队高效协同;
5. 对NPU进行功耗分析与建模,运用功耗优化工具识别能效优化关键点,以芯片低功耗技术为基础手段,协同算法软件团队,通过算法调整和编译优化,实现软件层的功耗降低,确保整体系统在各类运行场景下的能效最大化。
包括英文材料
算法+
相关职位

logo of dji
社招3年以上芯片

1. 负责芯片的需求分析、规格定义及架构设计,进行性能等指标分解,确保芯片满足PPA目标; 2. 带领团队进行芯片性能分析,识别性能瓶颈并给出架构/设计优化方案,推动优化落地; 3. 芯片回片后,跟进设计及性能指标测试及闭环,指导下一代芯片设计优化; 4. 与软件团队进行软硬件联合优化,支持软件进行芯片性能调优,确保芯片在产品中发挥性能潜力; 5. 持续对标SOC芯片架构及性能优化领域先进技术,制定技术路线图,主导架构设计前沿技术预研及落地。

更新于 2025-01-03上海|深圳
logo of tongyi
社招8年以上技术类-开发

1. 作为技术负责人,制定并推动多模态交互系统的端云整体工程架构演进路线,覆盖端侧推理、客户端集成、云端服务及协同策略。 2. 主导端侧AI推理框架的设计与优化,包括模型加载、算子加速、内存管理、功耗控制、异构计算(CPU/GPU/NPU)调度等,确保大模型在资源受限设备上的高效运行。 3. 负责Android客户端核心交互模块的架构设计与开发,包括多模态输入采集、实时通信、状态管理、离在线切换、异常恢复等关键能力。 4. 设计高并发、低延迟、可扩展的云端推理服务架构,支持语音识别、大模型生成、多模态融合等服务的弹性部署与动态扩缩容。 5. 构建端云协同机制,实现任务卸载、上下文同步、模型热更新、A/B测试等能力,提升系统整体鲁棒性与迭代效率。 6. 带领应用工程团队,负责关键技术方案评审、核心模块编码、性能压测、线上稳定性保障及团队技术能力建设。 7. 与算法、产品、芯片、测试及客户解决方案团队紧密协作,推动系统从原型验证到规模化商用落地。

更新于 2025-11-20北京|杭州
logo of kuaishou
社招5年以上D8039

1.负责AI平台架构设计和AI工程化技术实现; 2.通过AI基础设施和软硬件协同优化来提升公司AI模型训练和推理的效率; 3. 负责云侧或端侧大模型和小模型推理服务开发、性能优化、上线部署等工作。

更新于 2025-04-01杭州
logo of horizon
社招5年以上芯片序列

职责描述: 1. 个人或者带领小组承担重点模块/子系统/技术专题的规划和设计工作,包括目标定义,方案/微架构/框架规划,文档撰写,代码实现,为模块的功能和PPA目标负责。 2. 协助DV/CV开展验证工作,协助ME/BE完成物理实现,以确保功能正确和PPA目标达成; 3. 参与NPU核心自研IP的架构规划、建模、评估、优化; 4. 在所承担的技术工作中,统筹内外资源,负责内部分工督导以及外部沟通协调,进行技术判断和决策;

更新于 2025-10-20北京