
商汤26届AI领航员-研究院-大模型算法研究员(模型训练)
校招全职算法研究地点:北京 | 上海 | 深圳状态:招聘
任职要求
1. 具有丰富大模型训练实际经验,熟练使用DeepSpeed,Megatron-Lm 等相关训练工具; 2. 具有良好的计算机体系结构基础和代码优化能力; …
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 负责大模型算法框架的研发,整体提升算法框架训练效率,跟进最近的训练技术; 2. 负责探索MOE、RLHF 等相关对齐技术,提升模型的最终效果; 3. 负责多模态模型和Function Call 模型的联合训练,整体优化多模态模型和语言模型联合训练。
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
DeepSpeed+
https://www.youtube.com/watch?v=pDGI668pNg0
Megatron+
https://www.youtube.com/watch?v=hc0u4avAkuM
还有更多 •••
相关职位
社招2-5年技术
1. 负责滴滴代驾乘客端App、小程序,司机端App,以及运营和营销平台等系统的研发工作; 2. 与产品、设计沟通,并能够针对不同业务需求给出前端技术解决方案; 3. 深度参与App和小程序的性能优化、稳定性保障、架构升级,以及组件化建设等相关工作,提升软件体验和研发效率;
更新于 2025-04-01杭州
实习网易云音乐
1、负责云音乐AI基建平台相关业务相关服务端开发; 2、负责业务AI相关落地; 3、根据产品需求完成服务器端设计、开发以及文档编写等工作; 4、优化系统性能, 改善系统的稳定性及易用性,提升用户体验。
更新于 2025-08-12杭州
实习网易游戏(雷火)
1.与编剧团队合作,共同细化和丰富游戏故事和世界观。 2.基于核心叙事设定和剧本,与关卡、玩法、美术部门密切沟通和合作,设计并协助实现关卡内的叙事内容。 3.规划和跟进叙事内容所需资产的制作和表现,实现高质量的in-game叙事体验。 4.与程序、技术策划合作,协助设计和完善叙事落地的相关工具。
更新于 2025-06-21杭州