logo of dji

大疆高级嵌入式工程师(高性能计算)

社招全职8年以上嵌入式地点:深圳 | 上海状态:招聘

任职要求


1. 8年以上编译器开发经验,精通C++/Python,熟悉TVM/MLIR/LLVM等工具;
2. 深入理解NPU/GPU架构及计算特性,具备芯片软硬件协同优化经验;
3. 具备完整的AI编译器开发经验;
4. 熟悉AI模型压缩、量化等技术,了解自动驾驶大模型等场景的编译需求。

工作职责


1. 负责AI编译器技术路线制定,主导自研AI编译器整体架构设计;
2. 负责NN编译优化技术方案,包括图优化、算子融合、内存分配等核心模块设计;
3. 负责NN编译与硬件协同设计,参与NPU指令集和架构设计,芯片性能验证等;
4. 负责跟踪AI编译器领域技术演进,规划技术演进方向与推动落地。
包括英文材料
C+++
Python+
LLVM+
自动驾驶+
大模型+
相关职位

logo of dji
社招4年以上嵌入式

1. 负责自研芯片AI编译器方案设计及开发实现(侧重点为高能效比与加速器的高利用率); 2. 负责开发编译器后端优化Pass,如指令调度、内存分配等,最大化发挥NPU算力; 3. 负责开发编译器性能调优工具链,支持模型推理效率分析和自动化优化。

更新于 2025-05-22
logo of dji
社招5年以上软件

1. 负责相机业务软件核心框架的开发,保证其高性能、稳定性、低耦合等; 2. 负责框架基础组件/业务的方案设计、运营、提效; 3. 负责效能工具的发掘、设计、开发; 4. 负责支持产品化阶段遇到的框架性能、稳定性问题分析等。

更新于 2025-07-03
logo of dji
社招嵌入式

1. 大规模及中小规模模型分布式训练的性能优化,包括数据读取、算子优化、通信优化、显存优化等,加速训练过程,提升训练系统稳定性、资源利用效率及面向目标平台(如嵌入式设备)的可部署性; 2. 持续分析、优化大规模多机集群及中小规模训练任务的性能,与算法同事协作优化训练系统的整体效率和稳定性; 3. 负责云端推理服务的性能优化与落地,包括模型转换、计算图优化、算子融合、低精度推理(INT8/FP16)、推理框架适配(如TensorRT等),提升推理吞吐量、降低延迟和资源消耗; 4. 跟进业内先进的训练框架、推理框架及训练/推理优化技术,推动其在业务中的实践。

更新于 2025-06-24
logo of dji
社招4年以上嵌入式

1. 负责NN算法、图像算法在主流移动端处理器上的部署和优化,达成模型(含大模型)推理的耗时/功耗等目标; 2. 负责NN部署框架设计、开发实现、算子优化和工具链维护; 3. 负责撰写相关业务设计文档。

更新于 2025-06-20