
商汤高级算法研究员(世界模型)
任职要求
1. 聚焦自动驾驶世界模型全链路研发,构建支撑端到端强化学习的核心能力: 2. 模型全生命周期开发:主导自动驾驶世界…
工作职责
1. 聚焦自动驾驶世界模型全链路研发,构建支撑端到端强化学习的核心能力: 2. 模型全生命周期开发:主导自动驾驶世界模型的架构设计、训练策略制定及多维度评估体系搭建,确保模型输出满足端到端 RL 训练的时序一致性与状态表征精度要求。

视频理解与表征学习: 参与研究和实现基于Transformer、Diffusion等先进架构的视频理解模型,用于视频场景理解、动作识别、事件预测等任务。 视频生成与控制: 协助探索视频生成模型(如Video Diffusion Models, Sora-like architectures),并研究如何通过自然语言或高级指令(如Agent规划)实现对生成内容的精准控制(如控制物体运动、摄像机视角等)。 Agent决策框架搭建: 参与构建视频领域的AI Agent框架,使其能够根据指令(如“生成一个宇航员在月球后空翻的视频”)自动进行任务分解、调用合适的模型(如生成、编辑、特效模型)并执行多步规划。 仿真环境与评估体系: 参与构建或利用视频仿真环境,用于训练和评估Video Agent的决策能力。设计和开发定量与定性相结合的评估方案,以衡量生成视频的质量和Agent任务完成的准确度。 技术调研与原型验证: 紧跟视频生成、世界模型、AI Agent等领域的最新学术进展(如CVPR, ICCV, NeurIPS等顶会论文),并快速进行代码复现和实验。
1.协助团队进行游戏AI的研究与开发,包括但不限于强化学习、LLM等技术; 2.能够基于LLM构建应用,并能使用强化学习等手段优化模型性能; 3.參与项目的需求分析、建模设计、开发; 4.与团队成员紧密合作,共同解决项目中的技术难题; 5.跟踪并研究最新的AI技术和趋势,将其应用于游戏Al项目中; 6.编写高质量的技术文档,分享技术成果和知识。
1.协助团队进行游戏AIGC的研究与开发,熟悉LLM、AR、Diffusion等技术; 2.参与项目的需求分析、建模设计和开发; 3.与团队成员紧密合作,共同解决项目中的技术难题; 4.跟踪并研究最新的AI技术和趋势,将其应用于游戏Al项目中; 5.编写高质量的技术文档,分享技术成果和知识。