
商汤26届AI领航员-研究院-大模型训练系统研究员
校招全职算法研究地点:上海状态:招聘
任职要求
1.本科及以上学历、计算机、软件工程等相关专业优先; 2. 3年及以上相关工作经验,有扎实的计算机科学知识,熟练掌握Pytorch,具备良好的编程能力和代码风格; 3. 对AI大模型相关核心技术原理有完整的认识, 熟悉megatron deepspeed等种大模型加速框架; 4.有AI大模型性能调优经验,模型量化和稀疏化经…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 参与深度学习框架的代码实现,开发框架支持大模型训练、微调能力,提升系统速度和系统稳定性; 2. 持续扩充核心框架的功能和计算能力,优化系统的架构和模型设计,保持一定的业务和技术前瞻性; 3.与产品和测试以及其他研发团队深入协作,解决关键问题,完成研发计划; 4.负责大模型训练相关技术,方案及架构设计沟通、规划、撰写; 5.调研分析海内外产品技术实现,探索创新方向。
包括英文材料
学历+
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
还有更多 •••
相关职位

校招算法研究
1. 负责大模型算法框架的研发,整体提升算法框架训练效率,跟进最近的训练技术; 2. 负责探索MOE、RLHF 等相关对齐技术,提升模型的最终效果; 3. 负责多模态模型和Function Call 模型的联合训练,整体优化多模态模型和语言模型联合训练。
更新于 2025-08-21北京|上海|深圳

校招算法研究
1.负责开发和研究模型自我优化与进化的算法,通过引入先进的自适应学习技术和进化策略,实现模型在面对新数据时的自动调整和优化; 2.设计和实施自我进化机制,包括但不限于在线学习、持续学习和元学习策略,以提升模型对新环境和新任务的适应性; 3.通过周期性的模型评估和反馈循环,确保模型在实际应用中的性能持续提升,同时解决模型过时的问题; 4.负责大模型训练数据生成及管理,包括合成数据生成和真实数据的收集与清洗; 5.负责建立和维护数据处理流程,以提高数据质量和训练效率; 6.负责开发和优化数据监控系统,进行日志数据的智能分析,及时发现并解决数据处理过程中的问题。 7.与数据科学团队合作,确保模型进化策略与数据获取、处理和分析策略的一致性,从而优化整个模型的学习效率和效果。
更新于 2025-08-21北京|上海|深圳

校招算法研究
1.探索大模型后训练的技术边界,持续提升模型的通用人工智能能力; 2.研究强化学习,过程监督等方法在提升模型能力上的最前沿技术; 3.研究长思维链推理中的核心问题,如幻觉抑制,长度压缩等。
更新于 2025-08-21北京|深圳