logo of deepseek

深度求索深度学习研发工程师(北京/杭州)

社招全职DeepSeek地点:杭州 | 北京状态:招聘

任职要求


1. 了解机器学习深度学习)的各类模型,具备较强的工程能力;
2. 编程能力出色,熟练掌握PythonC++,掌握Pyt…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 既懂算法又懂系统;
2. 既能调精度也能调性能;
3. 既考虑训练也考虑推理部署。
包括英文材料
机器学习+
深度学习+
Python+
还有更多 •••
相关职位

logo of liauto
社招3年以上汽车研发

岗位职责 负责分析和优化大模型的分布式训练全链路过程,以提升训练性能和效率

北京
logo of aliyun
社招技术类-开发

1. 负责灵骏集群的AI系统性能分析与优化,支持客户多个AI作业场景在不同平台芯片和多种集群规模下的适配和性能调优,能快速且以工具/产品化方式识别性能瓶颈并提出解决方案; 2. 针对主流深度学习框架、分布式训练和模型部署场景等,进行性能调优,优化算子性能、通信性能、内存利用率等关键指标,提升集群整体运行效率; 3. 对AI系统进行性能建模与仿真,建立Roofline模型等性能分析工具。通过仿真结果辅助系统设计和资源分配,为集群建设提供数据支持;同时推荐最佳训练和模型部署配置,辅助用户拿到最佳性能实践; 4. 负责开发和维护性能分析工具,支持系统性能监控、瓶颈定位和优化效果评估,提供性能分析报告,为团队和客户提供性能优化建议。

更新于 2025-06-18北京|杭州
logo of tencent
社招1年以上公共技术

1.参与Pytorch等大模型深度学习框架的研发工作,重点负责GPU及异构芯片的适配与性能优化; 2.深入研究框架引擎内部机制,参与或主导前沿大模型相关技术的探索与实践; 3.与团队合作,持续提升系统的稳定性和扩展性,确保系统能够满足大规模深度学习任务的需求。

更新于 2026-01-05深圳
logo of aliyun
社招技术类-开发

1. 负责灵骏集群的AI系统性能分析与优化,支持客户多个AI作业场景在不同平台芯片和多种集群规模下的适配和性能调优,能快速且以工具/产品化方式识别性能瓶颈并提出解决方案; 2. 针对主流深度学习框架、分布式训练和模型部署场景等,进行性能调优,优化算子性能、通信性能、内存利用率等关键指标,提升集群整体运行效率; 3. 对AI系统进行性能建模与仿真,建立Roofline模型等性能分析工具。通过仿真结果辅助系统设计和资源分配,为集群建设提供数据支持;同时推荐最佳训练和模型部署配置,辅助用户拿到最佳性能实践; 4. 负责开发和维护性能分析工具,支持系统性能监控、瓶颈定位和优化效果评估,提供性能分析报告,为团队和客户提供性能优化建议。

更新于 2025-07-02北京|杭州