logo of sensetime

商汤26届AI领航员-研究院-大模型训练系统研究员

校招全职算法研究地点:上海状态:招聘

任职要求


1.本科及以上学历、计算机、软件工程等相关专业优先;
2. 3年及以上相关工作经验,有扎实的计算机科学知识,熟练掌握Pytorch,具备良好的编程能力和代码风格;
3. 对AI大模型相关核心技术原理有完整的认识, 熟悉megatron deepspeed等种大模型加速框架;
4.有AI大模型性能调优经验,模型量化和稀疏化经…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 参与深度学习框架的代码实现,开发框架支持大模型训练、微调能力,提升系统速度和系统稳定性;
2. 持续扩充核心框架的功能和计算能力,优化系统的架构和模型设计,保持一定的业务和技术前瞻性;
3.与产品和测试以及其他研发团队深入协作,解决关键问题,完成研发计划;
4.负责大模型训练相关技术,方案及架构设计沟通、规划、撰写;
5.调研分析海内外产品技术实现,探索创新方向。
包括英文材料
学历+
PyTorch+
大模型+
还有更多 •••
相关职位

logo of sensetime
校招算法研究

1. 负责大模型算法框架的研发,整体提升算法框架训练效率,跟进最近的训练技术; 2. 负责探索MOE、RLHF 等相关对齐技术,提升模型的最终效果; 3. 负责多模态模型和Function Call 模型的联合训练,整体优化多模态模型和语言模型联合训练。

更新于 2025-08-21北京|上海|深圳
logo of sensetime
校招算法研究

1.负责开发和研究模型自我优化与进化的算法,通过引入先进的自适应学习技术和进化策略,实现模型在面对新数据时的自动调整和优化; 2.设计和实施自我进化机制,包括但不限于在线学习、持续学习和元学习策略,以提升模型对新环境和新任务的适应性; 3.通过周期性的模型评估和反馈循环,确保模型在实际应用中的性能持续提升,同时解决模型过时的问题; 4.负责大模型训练数据生成及管理,包括合成数据生成和真实数据的收集与清洗; 5.负责建立和维护数据处理流程,以提高数据质量和训练效率; 6.负责开发和优化数据监控系统,进行日志数据的智能分析,及时发现并解决数据处理过程中的问题。 7.与数据科学团队合作,确保模型进化策略与数据获取、处理和分析策略的一致性,从而优化整个模型的学习效率和效果。

更新于 2025-08-21北京|上海|深圳
logo of sensetime
校招算法研究类

1. 多模态理解与生成算法研究: 紧跟领域前沿,深入研究多模态(图像、文本、视频)的理解与生成统一的核心算法; 2. 模型设计与优化: 负责多模态理解与生成模型的设计、训练、评估和优化,不断提升模型性能和泛化能力; 3. 创新技术探索: 探索新的预训练和后训练范式,发现和解决大模型靠单一模态难以解决的问题。

更新于 2025-08-21北京|上海|深圳
logo of sensetime
校招算法研究

1.探索大模型后训练的技术边界,持续提升模型的通用人工智能能力; 2.研究强化学习,过程监督等方法在提升模型能力上的最前沿技术; 3.研究长思维链推理中的核心问题,如幻觉抑制,长度压缩等。

更新于 2025-08-21北京|深圳