logo of dji

大疆中/高级高性能计算工程师(训练优化)

社招全职嵌入式地点:深圳 | 上海状态:招聘

任职要求


1.  计算机科学、信息工程、电子工程、机器人等专业本科及以上学历;
2.  具备扎实的编程能力,熟练使用Python/C++进行开发;
3.  熟练使用Pytorch训练框架,掌握训练性能分析方法;
4.  熟悉常见的分布式训练优化技术,如数据并行、模型并行、流水线并行等;
5.  具备云端模型推理部署和性能优化的实际经验,了解模型轻量化、压缩技术(如剪枝、量化、知识蒸馏);
6.  具备良好的编程风格习惯、文档撰写能力、团队协作和沟通表达能力。

工作职责


1.  大规模及中小规模模型分布式训练的性能优化,包括数据读取、算子优化、通信优化、显存优化等,加速训练过程,提升训练系统稳定性、资源利用效率及面向目标平台(如嵌入式设备)的可部署性;
2.  持续分析、优化大规模多机集群及中小规模训练任务的性能,与算法同事协作优化训练系统的整体效率和稳定性;
3.  负责云端推理服务的性能优化与落地,包括模型转换、计算图优化、算子融合、低精度推理(INT8/FP16)、推理框架适配(如TensorRT等),提升推理吞吐量、降低延迟和资源消耗;
4.  跟进业内先进的训练框架、推理框架及训练/推理优化技术,推动其在业务中的实践。
包括英文材料
学历+
Python+
C+++
PyTorch+
相关职位

logo of momenta
社招2年以上

岗位职责 1. 负责智能驾驶模型训练优化的研究和落地,通过数据并行,模型并行,通信优化,CUDA算子优化等手段,大幅提升模型的训练速度与效率。 2. 解决智能驾驶模型训练和部署工作中遇到的各种工程和性能问题。负责训练相关的工具链和框架的开发,维护,和优化。

更新于 2024-11-05
logo of tencent
社招微信技术

1.负责微信计算机视觉、语音、推荐、语言模型等 AI 算法业务在微信小程序、视频号、企业微信、微信读书、输入法等场景中的多平台落地与性能优化; 2.引导算法团队设计性能/功耗兼顾的算法。

更新于 2025-06-25
logo of tencent
社招微信技术

1.负责微信计算机视觉、语音、推荐、语言模型等 AI 算法业务在微信小程序、视频号、企业微信、微信读书、输入法等场景中的多平台落地与性能优化; 2.引导算法团队设计性能/功耗兼顾的算法。

更新于 2025-06-25
logo of shein
社招3年以上信息技术类

高级/资深算法工程师(国际支付风控方向),base上海/南京 1.支付风险识别与防控 ●负责跨境电商业务中支付风险的全面识别与防控,重点治理欺诈(盗卡、盗账户 友好欺诈)等方面风险,确保支付全链路安全可靠。 ●利用数据分析和机器学习技术,精确识别支付风险,建立有效的风控模型体系。 2.风控模型全链路管理 ●主导支付风控模型的全链路开发与上线工作,包括需求调研、风险探索、方案设计、模型开发、系统集成、部署上线、效果评估、持续优化和监控预警。 ●与产品、工程、业务团队紧密合作,确保风控模型精准全面覆盖业务场景,并能够及时应对市场变化。 3.前沿技术应用与创新 ●深入探索全球各大市场的新型支付作弊行为,利用多模态大数据进行风险评估与预测。 ●应用异常检测、集成学习、强化学习、序列模型、图模型、大规模预训练模型等前沿技术,提升风险识别的准确率和召回率。

更新于 2025-04-16