商汤大装置-大模型训练优化研究员

社招全职3年以上系统研究2025-04-09地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1.本科及以上学历、计算机、软件工程等相关专业优先；
2. 3年及以上相关工作经验，有扎实的计算机科学知识，熟练掌握Pytorch，具备良好的编程能力和代码风格。
3. 对AI大模型相关核心技术原理有完整的认识,熟悉megatron deepspeed等种大模型加速框架。
4.具备良好的技术、产品、项目文档撰写能力，调研能力、战略思维。
5. 具备优秀的沟通能力，具备跨领域技术团队管理协…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 参与深度学习框架的代码实现,开发框架支持大模型训练、微调能力，提升系统件能和系统稳定性。
2. 持续扩充核心框架的功能和计算能力,优化系统的架构和模型设计,保持一定的业务和技术前瞻性。
3.与产品和测试以及其他研发团队深入协作，解决关键问题，完成研发计划。
4.负责大模型训练相关技术，方案及架构设计沟通、规划、撰写。
5.调研分析海内外产品技术实现，探索创新方向。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

PyTorch+

大模型+

Megatron+

还有更多 •••

登录查看完整学习资料

相关职位

大装置-大模型训练/推理优化研究员

社招3年以上系统研究

岗位可以选择训练框架开发/推理优化两个方向训练框架: 1. 参与深度学习框架的代码实现,开发框架支持大模型训练、微调能力，提升系统件能和系统稳定性。 2. 持续扩充核心框架的功能和计算能力,优化系统的架构和模型设计,保持一定的业务和技术前瞻性。 3.与产品和测试以及其他研发团队深入协作，解决关键问题，完成研发计划。 4.负责大模型训练相关技术，方案及架构设计沟通、规划、撰写。 5.调研分析海内外产品技术实现，探索创新方向。推理优化： 1. 参与开发大模型推理框架，提升系统性能和系统稳定性。 2. 持续扩充核心框架的功能和计算能力,优化系统的架构和模型设计,保持一定的业务和技术前瞻性。 3.与产品和测试以及其他研发团队深入协作，解决关键问题，完成研发计划。 4.负责大模型推理相关技术，方案及架构设计沟通、规划、撰写。 5.调研分析海内外产品技术实现，探索创新方向.

更新于 2026-04-03北京|上海

26届AI领航员-大装置-算法开发工程师（交付落地方向）

校招技术开发类

1. 负责实现和迭代自然语言处理相关算法，支撑企业数字化业务中的自然语言理解和生成需求，例如信息抽取、文档分析、检索问答、对话交互等； 2. 深度参与客户工程业务实现，将算法和企业业务需求应用相配合，实现客户端到端业务需求，实现LLM的落地最后一公里； 3. 积极跟进LLM SOTA技术，能够迅速在某一细分领域的深入掌握最新算法，包括但不限于基础模型跟进、推理框架优化、SFT训练及Agent智能体开发； 4. 设计和开发基于大语言模型（LLM）的智能Agent，优化其在不同业务场景中的任务规划、工具调用及自主决策能力； 5. 培训非LLM专业人员，使之具备基本标准业务落地AI赋能能力。

更新于 2025-08-01北京

大装置-IaaS高性能网络开发工程师

社招3年以上系统研究

1. 设计和实现多租户高性能 SDN 控制模块，基于 IB 网络和 RDMA 通信协议，以实现高效、稳定的大模型训练数据交换。 2. 提出合理的设备选型和组网架构方案，确保网络的稳定性和可靠性。对于网络故障，进行排查和解决，保证网络的正常运行。 3. 根据业务场景开发云网络功能模块，优化高速网络的数据传输效率、降低相应时间，并提升运维管理能力。 4. 深入了解 NVIDIA QUANTUM 和 SPECTRUM 交换机以及 ConnectX 网卡的主要特性和功能原理，以便能够充分利用其性能优势。 5. 编写相关文档和测试用例，确保产品的质量和稳定性。与团队成员和其他相关部门进行有效的沟通和协作，推动项目的进展并达成目标。

更新于 2025-08-15北京|上海|深圳

大装置-技术产品经理

社招3年以上技术产品管理

团队介绍商汤科技国产化团队致力于将行业领先的AI大模型技术与国内自主创新的算力基础设施深度融合。团队负责打通从底层异构芯片到上层大模型应用的全链路，构建高效、稳定、自主的AI生产力平台。加入我们，你将有机会与顶尖的技术专家合作，定义和打造适配国产算力生态的下一代AI产品，亲身参与并引领这场波澜壮阔的技术变革。岗位职责 1. 市场与技术洞察：深入研究和分析国产异构算力芯片的技术路线、生态发展及市场趋势；深刻理解主流大模型（LLM、多模态等）的技术架构、训练与推理范式。 2. 产品规划与定义：负责大装置在国产化算力上的适配与优化产品规划。主导需求分析，撰写高质量的产品需求文档（PRD），清晰定义产品功能、性能指标、验收标准及技术边界。 3. 项目推动与协同：作为产品负责人，与算法、AI框架、底层硬件优化、测试及业务团队紧密合作，拉通端到端的产品研发流程，确保产品按时、高质量交付。 4. 技术方案对齐：深度参与技术方案讨论，能够从产品视角出发，对模型适配、算子开发、编译优化、推理部署等关键技术环节提出建设性意见，确保技术方案最大化满足产品和市场需求。 5. 生态合作与赋能：与国内主流芯片厂商、服务器厂商及重要客户建立技术交流渠道，传递产品价值，收集核心需求，共同推动国产AI生态的繁荣。 6. 产品生命周期管理：负责产品的全生命周期管理，持续跟进产品上线后的表现，收集用户反馈，并基于数据和反馈驱动产品的迭代优化。

更新于 2025-08-21北京|上海