logo of tencent

腾讯腾讯游戏-多模态世界模型算法研究员-场景重建方向

社招全职3年以上公共技术地点:深圳状态:招聘

任职要求


1.教育背景:人工智能、计算机科学、数学或相关专业,硕士及以上学历,博士优先;
2.编程能力:熟练掌握 PyTorch 等主流深度学习框架,具备扎实的编程能力与工程实现能力;能够高质量复现前沿论文,并推动算法从研究原型到工程实现;
3.满足以下任意一种技术栈要求:(1)场景重建:熟悉NeRF/3DGS、3R系列、VGGT、MVS、SLAM等方法,对重建任务有深入理…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责世界模型(World Model)相关核心算法的研发与落地,包括但不限于场景重建、场景生成、场景理解等方向;
2.探索面向游戏世界的新一代场景重建和生成技术,构建可交互、可编辑、可理解的3D游戏场景。
包括英文材料
学历+
PyTorch+
深度学习+
算法+
SLAM+
还有更多 •••
相关职位

logo of tencent
社招3年以上公共技术

1.负责世界模型(World Model)相关核心算法的研发与落地,包括但不限于场景重建、场景生成、场景理解等方向; 2.探索面向游戏世界的新一代场景重建和生成技术,构建可交互、可编辑、可理解的3D游戏场景。

更新于 2026-01-08上海
logo of amap
社招3年以上技术类-算法

这个世界的运行机制是否是可计算的?世界的复杂性是否唯有用AI的复杂性来应对?人类是否可以造出一台机器让未来就像过去一样历历在目?面对这些未知而又迷人的世界级难题,阿里巴巴旗下高德地图将组建一支卓越的AI队伍向世界模型发起冲击。在这里,你将获得无限制的算力,让想象力在算力的加持下尽情驰骋;在这里,你将和顶级的空间智能专家并肩作战,让专业与专注碰撞出世界模型最精彩的火花;在这里,你将接触到高德积累了20年的海量真实世界数据,让包罗万象的数据发挥它本来应有的价值。 一、团队介绍 我们是阿里巴巴旗下高德视觉技术中心的具身世界模型团队。这里有自由探索、开放交流的技术氛围,让每个有价值的idea都得到充分的展现和验证。这里有来自国内外顶尖院校毕业的研究员,知名AI项目/论文的作者可能就坐在你身边,让顶尖智力一起碰撞出最美妙的火花。我们是一支兼具学术界和产业界视角的团队,仰望星空,脚踏实地。 团队gihub主页:https://github.com/amap-cvlab 二、我们要去哪? 1、打造可交互、可控制、物理一致的世界模型,突破空间智能技术边界 2、通过世界模型加速物理智能体的进化 3、探索下一代时空基座模型 三、岗位职责: 1. 3D动/静态生产: 利用三维重建、生成模型、多模态大模型对单图、视频完成动态物体/静态场景重建、生成、编辑,并得到可交互的3D资产与长时序视频; 2. 结合3D表征的视频生成: 研发基于动作、轨迹等条件控制的视频生成算法,确保生成内容具备严格的3D几何一致性与物理规律遵循,实现对场景视角、物体交互的精细化控制,为具身智能体提供高保真的虚拟训练环境; 3. 空间推理: 赋予模型深度的三维空间理解与物理常识推理能力(如物体可供性、碰撞动力学、场景拓扑),使其能理解场景背后的物理因果,辅助下游的复杂决策与规划; 4. 训练闭环搭建: 构建“生成-仿真-评估-优化”的自动化数据闭环,利用生成数据扩充训练集(Data Augmentation),并通过端到端系统的反馈迭代优化世界模型,实现数据飞轮效应; 5. 世界模型构建: 结合具身智能、自动驾驶等数据探索空间智能的统一范式,完成环境感知、智能体预测、决策规划等任务并得到未来状态和未来传感器信息,为强化学习提供基座; 6. 产线落地与性能优化: 与具身智能、自动驾驶、智能导航等业务协同,完善仿真数据链路,优化模型推理效率与显存占用; 7. 前沿追踪: 跟踪学术界和工业界在生成式AI/世界模型相关领域的最新进展,保持公司在该领域的技术领先地位。

更新于 2025-12-29北京
logo of sensetime
校招技术开发类

工作职责1. 参与世界模型生成算法服务部署工作,进行世界模型在智驾和具身领域的产品与工程落地; 2. 在NV-GPU等云端环境,开发优化算子与算法调度流程; 3. 开发模型部署与精度评测框架服务;

更新于 2025-12-02北京|杭州|上海
logo of bytedance
社招J1XR2

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索研究多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、探索多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化;提升数据合成、Scalable Oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent; 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。

更新于 2021-08-31北京