logo of dji

大疆高级嵌入式工程师(高性能计算)

社招全职8年以上嵌入式地点:深圳 | 上海状态:招聘

任职要求


1. 8年以上编译器开发经验,精通C++/Python,熟悉TVM/MLIR/LLVM等工具;
2. 深入理解NPU/GPU架构及计算特性,…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责AI编译器技术路线制定,主导自研AI编译器整体架构设计;
2. 负责NN编译优化技术方案,包括图优化、算子融合、内存分配等核心模块设计;
3. 负责NN编译与硬件协同设计,参与NPU指令集和架构设计,芯片性能验证等;
4. 负责跟踪AI编译器领域技术演进,规划技术演进方向与推动落地。
包括英文材料
C+++
Python+
还有更多 •••
相关职位

logo of jd
社招2年以上算法开发岗

1、负责无人配送场景下learning-based和rule-based的无人车决策、规划算法设计开发,包括但不限于横向决策、纵向决策、时空联合决策、时空联合规划、freespace场景决策规划等; 2、负责高性能、高可靠性的自动驾驶架构设计和工程优化,满足车端嵌入式平台的性能要求; 3、基于业务场景需要,协同自动驾驶其他功能模块完成全链路算法开发、测试和上线;

更新于 2025-06-09北京
logo of dji
社招5年以上软件

1. 负责相机业务软件核心框架的开发,保证其高性能、稳定性、低耦合等; 2. 负责框架基础组件/业务的方案设计、运营、提效; 3. 负责效能工具的发掘、设计、开发; 4. 负责支持产品化阶段遇到的框架性能、稳定性问题分析等。

更新于 2025-07-03深圳
logo of dji
社招嵌入式

1. 大规模及中小规模模型分布式训练的性能优化,包括数据读取、算子优化、通信优化、显存优化等,加速训练过程,提升训练系统稳定性、资源利用效率及面向目标平台(如嵌入式设备)的可部署性; 2. 持续分析、优化大规模多机集群及中小规模训练任务的性能,与算法同事协作优化训练系统的整体效率和稳定性; 3. 负责云端推理服务的性能优化与落地,包括模型转换、计算图优化、算子融合、低精度推理(INT8/FP16)、推理框架适配(如TensorRT等),提升推理吞吐量、降低延迟和资源消耗; 4. 跟进业内先进的训练框架、推理框架及训练/推理优化技术,推动其在业务中的实践。

更新于 2025-06-24深圳|上海
logo of dji
社招4年以上嵌入式

1. 负责NN算法、图像算法在主流移动端处理器上的部署和优化,达成模型(含大模型)推理的耗时/功耗等目标; 2. 负责NN部署框架设计、开发实现、算子优化和工具链维护; 3. 负责撰写相关业务设计文档。

更新于 2025-06-20深圳