
商汤高级算法研究员(世界模型)
1.协助团队进行游戏AI的研究与开发,包括但不限于强化学习、LLM等技术; 2.能够基于LLM构建应用,并能使用强化学习等手段优化模型性能; 3.參与项目的需求分析、建模设计、开发; 4.与团队成员紧密合作,共同解决项目中的技术难题; 5.跟踪并研究最新的AI技术和趋势,将其应用于游戏Al项目中; 6.编写高质量的技术文档,分享技术成果和知识。
1.协助团队进行游戏AIGC的研究与开发,熟悉LLM、AR、Diffusion等技术; 2.参与项目的需求分析、建模设计和开发; 3.与团队成员紧密合作,共同解决项目中的技术难题; 4.跟踪并研究最新的AI技术和趋势,将其应用于游戏Al项目中; 5.编写高质量的技术文档,分享技术成果和知识。
1.探索生成式模型的高级推理发生机制,提升大模型在复杂任务上的推理表现。包括但不限于RL scaling、Test time scaling等; 2.探索模型通过使用工具扩展能力边界,同复杂环境交互持续提升模型智能水平; 3.超大规模模型的强化学习性能优化,通过算法/工程的联合优化,极致加速模型训练和推理。

1.负责开发和研究模型自我优化与进化的算法,通过引入先进的自适应学习技术和进化策略,实现模型在面对新数据时的自动调整和优化; 2.设计和实施自我进化机制,包括但不限于在线学习、持续学习和元学习策略,以提升模型对新环境和新任务的适应性; 3.通过周期性的模型评估和反馈循环,确保模型在实际应用中的性能持续提升,同时解决模型过时的问题; 4.负责大模型训练数据生成及管理,包括合成数据生成和真实数据的收集与清洗; 5.负责建立和维护数据处理流程,以提高数据质量和训练效率; 6.负责开发和优化数据监控系统,进行日志数据的智能分析,及时发现并解决数据处理过程中的问题。 7.与数据科学团队合作,确保模型进化策略与数据获取、处理和分析策略的一致性,从而优化整个模型的学习效率和效果。