
商汤大装置-大模型训练优化研究员
任职要求
1.本科及以上学历、计算机、软件工程等相关专业优先; 2. 3年及以上相关工作经验,有扎实的计算机科学知识,熟练掌握Pytorch,具备良好的编程能力和代码风格。 3. 对AI大模型相关核心技术原理有完整的认识,熟悉megatron deepspeed等种大模型加速框架。 4.具备良好的技术、产品、项目文档撰写能力,调研能力、战略思维。 5. 具备优秀的沟通能力,具备跨领域技术团队管理协调能力,推动能力。 6.工作态度认真,做事主动、仔细。有强烈的责任心、有自驱力、抗压能力。 加分项: 1.熟悉NV以及国产化AI芯片技术,有训练推理性能优化经验。 2.高性能算子kernal开发经验,cuda、C++开发能力。3.有高性能网络 (overlav&underlay,rdma/ib/roce) 相关的经验4.有 Kubernetes等云产品、高性能云存储技术等,相关的经验。
工作职责
1. 参与深度学习框架的代码实现,开发框架支持大模型训练、微调能力,提升系统件能和系统稳定性。 2. 持续扩充核心框架的功能和计算能力,优化系统的架构和模型设计,保持一定的业务和技术前瞻性。 3.与产品和测试以及其他研发团队深入协作,解决关键问题,完成研发计划。 4.负责大模型训练相关技术,方案及架构设计沟通、规划、撰写。 5.调研分析海内外产品技术实现,探索创新方向。

1. 负责实现和迭代自然语言处理相关算法,支撑企业数字化业务中的自然语言理解和生成需求,例如信息抽取、文档分析、检索问答、对话交互等; 2. 深度参与客户工程业务实现,将算法和企业业务需求应用相配合,实现客户端到端业务需求,实现LLM的落地最后一公里; 3. 积极跟进LLM SOTA技术,能够迅速在某一细分领域的深入掌握最新算法,包括但不限于基础模型跟进、推理框架优化、SFT训练及Agent智能体开发; 4. 设计和开发基于大语言模型(LLM)的智能Agent,优化其在不同业务场景中的任务规划、工具调用及自主决策能力; 5. 培训非LLM专业人员,使之具备基本标准业务落地AI赋能能力。

1. 设计和实现多租户高性能 SDN 控制模块,基于 IB 网络和 RDMA 通信协议,以实现高效、稳定的大模型训练数据交换。 2. 提出合理的设备选型和组网架构方案,确保网络的稳定性和可靠性。对于网络故障,进行排查和解决,保证网络的正常运行。 3. 根据业务场景开发云网络功能模块,优化高速网络的数据传输效率、降低相应时间,并提升运维管理能力。 4. 深入了解 NVIDIA QUANTUM 和 SPECTRUM 交换机以及 ConnectX 网卡的主要特性和功能原理,以便能够充分利用其性能优势。 5. 编写相关文档和测试用例,确保产品的质量和稳定性。与团队成员和其他相关部门进行有效的沟通和协作,推动项目的进展并达成目标。

团队介绍 商汤科技国产化团队致力于将行业领先的AI大模型技术与国内自主创新的算力基础设施深度融合。团队负责打通从底层异构芯片到上层大模型应用的全链路,构建高效、稳定、自主的AI生产力平台。加入我们,你将有机会与顶尖的技术专家合作,定义和打造适配国产算力生态的下一代AI产品,亲身参与并引领这场波澜壮阔的技术变革。 岗位职责 1. 市场与技术洞察: 深入研究和分析国产异构算力芯片的技术路线、生态发展及市场趋势;深刻理解主流大模型(LLM、多模态等)的技术架构、训练与推理范式。 2. 产品规划与定义: 负责大装置在国产化算力上的适配与优化产品规划。主导需求分析,撰写高质量的产品需求文档(PRD),清晰定义产品功能、性能指标、验收标准及技术边界。 3. 项目推动与协同: 作为产品负责人,与算法、AI框架、底层硬件优化、测试及业务团队紧密合作,拉通端到端的产品研发流程,确保产品按时、高质量交付。 4. 技术方案对齐: 深度参与技术方案讨论,能够从产品视角出发,对模型适配、算子开发、编译优化、推理部署等关键技术环节提出建设性意见,确保技术方案最大化满足产品和市场需求。 5. 生态合作与赋能: 与国内主流芯片厂商、服务器厂商及重要客户建立技术交流渠道,传递产品价值,收集核心需求,共同推动国产AI生态的繁荣。 6. 产品生命周期管理: 负责产品的全生命周期管理,持续跟进产品上线后的表现,收集用户反馈,并基于数据和反馈驱动产品的迭代优化。