logo of dji

大疆中/高级高性能计算工程师(相机)

社招全职2年以上软件地点:深圳 | 上海状态:招聘

任职要求


1. 本科及以上学历,具备2年以上图像领域高性能计算开发背景;
2. 能够阅读芯片手册,对于自研和三方的DSP/GPU等算子进行接近硬件极限性能的开发;
3. 对于高性能计算,存储和通信有一定的理论基础,能基于算法在具体处理器上的性能,功耗和带宽等作预估;
4. 熟悉c/c++/python/shell/intrinsic c等开发语言;
5. 做事认真细心,积极主动,有责任心,有良好的沟通能力和抗压能力;
6. 熟悉nn/cv领域算法和并行计算架构,具备NEON,SVE,DSP、GPU等编程经验者优先。

工作职责


1. 负责影像拍照,录像,性能功耗领域的高性能算子开发,包括dsp,neon/sve,gpu,npu等;
2. 负责高性能算子集成到软件链路,具有一定的软件架构能力;
3. 负责编写高性能算子的质量测试,进而提升交付质量和效率;
4. 对于性能功耗极端场景,能够开发新的调度功能,细粒度调度模型和算子的开发;
5. 梳理业务需求,能够与自研高性能业务处理器形成有效迭代。
包括英文材料
学历+
算法+
C+
C+++
Python+
Bash+
相关职位

logo of dji
社招5年以上软件

1. 负责相机业务软件核心框架的开发,保证其高性能、稳定性、低耦合等; 2. 负责框架基础组件/业务的方案设计、运营、提效; 3. 负责效能工具的发掘、设计、开发; 4. 负责支持产品化阶段遇到的框架性能、稳定性问题分析等。

更新于 2025-07-03
logo of dji
社招嵌入式

1. 大规模及中小规模模型分布式训练的性能优化,包括数据读取、算子优化、通信优化、显存优化等,加速训练过程,提升训练系统稳定性、资源利用效率及面向目标平台(如嵌入式设备)的可部署性; 2. 持续分析、优化大规模多机集群及中小规模训练任务的性能,与算法同事协作优化训练系统的整体效率和稳定性; 3. 负责云端推理服务的性能优化与落地,包括模型转换、计算图优化、算子融合、低精度推理(INT8/FP16)、推理框架适配(如TensorRT等),提升推理吞吐量、降低延迟和资源消耗; 4. 跟进业内先进的训练框架、推理框架及训练/推理优化技术,推动其在业务中的实践。

更新于 2025-06-24
logo of dji
社招4年以上嵌入式

1. 负责NN算法、图像算法在主流移动端处理器上的部署和优化,达成模型(含大模型)推理的耗时/功耗等目标; 2. 负责NN部署框架设计、开发实现、算子优化和工具链维护; 3. 负责撰写相关业务设计文档。

更新于 2025-06-20
logo of dji
社招4年以上嵌入式

1. 负责自研芯片AI编译器方案设计及开发实现(侧重点为高能效比与加速器的高利用率); 2. 负责开发编译器后端优化Pass,如指令调度、内存分配等,最大化发挥NPU算力; 3. 负责开发编译器性能调优工具链,支持模型推理效率分析和自动化优化。

更新于 2025-05-22