logo of dji

大疆中/高级高性能计算工程师(推理优化)

社招全职4年以上嵌入式地点:深圳状态:招聘

任职要求


1. 硕士及以上学历,4年及以上相关经验;
2. 熟悉至少1款主流移动端处理器的芯片架构和NN优化策略,有基于NPU/DSP/GPU的NN和图像算法深入部署调优经验;
3. 熟悉至少1种主流NN部署框架,包括但不限于QNN/coreml/MNN/ncnn/caffe/tensorflow等;
4. 了解常用的模型压缩技术,包括不限于蒸馏、剪枝、量化、稀疏等;
5. 熟练掌握C/C++/python编程,具备良好的软件工程习惯;
6. 具备良好的学习能力,自驱力和沟通协调能力。

工作职责


1. 负责NN算法、图像算法在主流移动端处理器上的部署和优化,达成模型(含大模型)推理的耗时/功耗等目标;
2. 负责NN部署框架设计、开发实现、算子优化和工具链维护;
3. 负责撰写相关业务设计文档。
包括英文材料
学历+
算法+
Core ML+
MNN+
TensorFlow+
C+
C+++
Python+
相关职位

logo of dji
社招嵌入式

1. 大规模及中小规模模型分布式训练的性能优化,包括数据读取、算子优化、通信优化、显存优化等,加速训练过程,提升训练系统稳定性、资源利用效率及面向目标平台(如嵌入式设备)的可部署性; 2. 持续分析、优化大规模多机集群及中小规模训练任务的性能,与算法同事协作优化训练系统的整体效率和稳定性; 3. 负责云端推理服务的性能优化与落地,包括模型转换、计算图优化、算子融合、低精度推理(INT8/FP16)、推理框架适配(如TensorRT等),提升推理吞吐量、降低延迟和资源消耗; 4. 跟进业内先进的训练框架、推理框架及训练/推理优化技术,推动其在业务中的实践。

更新于 2025-06-24
logo of dji
社招4年以上嵌入式

1. 负责自研芯片AI编译器方案设计及开发实现(侧重点为高能效比与加速器的高利用率); 2. 负责开发编译器后端优化Pass,如指令调度、内存分配等,最大化发挥NPU算力; 3. 负责开发编译器性能调优工具链,支持模型推理效率分析和自动化优化。

更新于 2025-05-22
logo of oppo
校招AI/算法类

专注于大模型系统优化、异构计算的前沿技术研究和落地,研究领域包括不限于高性能大模型系统架构、LLM-as-a-Service技术等。 岗位职责: 1. 负责大模型轻量化及推理优化的研究,支持大模型在云侧及端侧的高效推理及微调; 2. 负责端上大模型及AI智能体运行引擎的研发和部署。

更新于 2025-07-23
logo of tencent
社招微信技术

1.负责 AI 异构计算平台研发,打造 NLP/视觉/语音 等算法模型跨平台部署全流程优化,实现 AI 算力在微信生态(视频号、小程序、企业微信、微信读书、微信输入法等)的通用化和普惠; 2.分析 CNN、Transformer 等常用结构在微信实际业务场景中的性能瓶颈,在 CPU/GPU/NPU 上完成高性能实现与软硬件协同调优,实现性能极致的跨平台推理引擎; 3.引导算法团队设计性能/功耗兼顾的算法。

更新于 2025-06-25