logo of amap

高德地图高德-世界模型算法工程师-视觉团队

社招全职3年以上技术类-算法地点:北京状态:招聘

任职要求


1、计算机科学、人工智能、机器人、应用数学、自动化或相关专业硕士及以上学历(博士优先);
2、在生成式模型、3D视觉、具身智能或强化学习等领域有深入的研究背景,具备扎实的数理统计/数学物理/深度学习/机器学习基础;
3、核心算法领域(至少精通以下其中一项,熟悉多项):
a.视频/图像生成: 深入理解 Diffusion Model (DDPM, LDM, DiT), VAE, GAN 等生成模型原理;熟悉视频生成架构(如Sora类DiT架构、Video LDM、SVD)及可控生成技术(如ControlNet, Adapter)。
b.3D重建与生成: 精通 NeRF, 3D Gaussian Splatting (3DGS) 等神经渲染技术,或熟悉 Multi-view Stereo (MVS), Structure from Motion (SfM) 等传统三维视觉算法;了解 3D Mesh/Point Cloud 生成模型。
c.世界模型与RL: 熟悉基于模型的强化学习(Model-based RL),了解 World Models (如Dreamer系列, JEPA架构),理解状态空间模型(SSM/Mamba)在长序列预测中的应用。
d.VLM与空间推理:深入理解 CLIP, LLaVA, Qwen…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


这个世界的运行机制是否是可计算的?世界的复杂性是否唯有用AI的复杂性来应对?人类是否可以造出一台机器让未来就像过去一样历历在目?面对这些未知而又迷人的世界级难题,阿里巴巴旗下高德地图将组建一支卓越的AI队伍向世界模型发起冲击。在这里,你将获得无限制的算力,让想象力在算力的加持下尽情驰骋;在这里,你将和顶级的空间智能专家并肩作战,让专业与专注碰撞出世界模型最精彩的火花;在这里,你将接触到高德积累了20年的海量真实世界数据,让包罗万象的数据发挥它本来应有的价值。

一、团队介绍
我们是阿里巴巴旗下高德视觉技术中心的具身世界模型团队。这里有自由探索、开放交流的技术氛围,让每个有价值的idea都得到充分的展现和验证。这里有来自国内外顶尖院校毕业的研究员,知名AI项目/论文的作者可能就坐在你身边,让顶尖智力一起碰撞出最美妙的火花。我们是一支兼具学术界和产业界视角的团队,仰望星空,脚踏实地。
团队gihub主页:https://github.com/amap-cvlab

二、我们要去哪?
1、打造可交互、可控制、物理一致的世界模型,突破空间智能技术边界
2、通过世界模型加速物理智能体的进化
3、探索下一代时空基座模型

三、岗位职责:
1. 3D动/静态生产: 利用三维重建、生成模型、多模态大模型对单图、视频完成动态物体/静态场景重建、生成、编辑,并得到可交互的3D资产与长时序视频;
2. 结合3D表征的视频生成: 研发基于动作、轨迹等条件控制的视频生成算法,确保生成内容具备严格的3D几何一致性与物理规律遵循,实现对场景视角、物体交互的精细化控制,为具身智能体提供高保真的虚拟训练环境;
3. 空间推理: 赋予模型深度的三维空间理解与物理常识推理能力(如物体可供性、碰撞动力学、场景拓扑),使其能理解场景背后的物理因果,辅助下游的复杂决策与规划;
4. 训练闭环搭建: 构建“生成-仿真-评估-优化”的自动化数据闭环,利用生成数据扩充训练集(Data Augmentation),并通过端到端系统的反馈迭代优化世界模型,实现数据飞轮效应;
5. 世界模型构建: 结合具身智能、自动驾驶等数据探索空间智能的统一范式,完成环境感知、智能体预测、决策规划等任务并得到未来状态和未来传感器信息,为强化学习提供基座;
6. 产线落地与性能优化: 与具身智能、自动驾驶、智能导航等业务协同,完善仿真数据链路,优化模型推理效率与显存占用;
7. 前沿追踪: 跟踪学术界和工业界在生成式AI/世界模型相关领域的最新进展,保持公司在该领域的技术领先地位。
包括英文材料
学历+
强化学习+
深度学习+
机器学习+
算法+
Framer Motion+
Python+
C+++
还有更多 •••
相关职位

logo of xiaohongshu
社招引擎

大模型具备很强的泛化及理解世界能力,在小红书内的众多生产场景遍地开花,大模型的训练和部署已成为许多算法工程师的日常。在多团队、多业务频繁使用的大规模GPU集群上,如何能够通过高效的GPU调度策略,使大家不仅能丝滑地完成训练及部署任务,同时也能充分激发大规模GPU集群的效能,是行业公认的关键挑战。在这里,你可以聚焦LLM场景,接触到超大规模GPU集群,并使用真实负载数据进行深入分析及技术探索。欢迎加入我们,一起探索领先技术改变世界! 工作职责: 1、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、集群调度、GPU虚拟化、故障快速恢复、存储&网络加速等手段,提升大规模GPU集群的整体使用效率。 2、负责构建面向大模型训练、微调、推理、部署全流程LLMOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地。 3、持续关注业界最新的GPU资源调度相关技术动态,探索建设业界领先的资源调度策略及方法,构建下一代大规模AI资源调度系统。

北京|上海
logo of xiaohongshu
社招2年以上大模型

【职位介绍】 我们团队负责构建小红书推荐算法中台,提高内容分发效率,为海量用户提供极致的推荐体验。在这里,你将参与到推荐系统的全链路搭建和各类算法的研发,包括不限于大模型应用、多模态建模、深度学习、强化学习、迁移学习、表示学习、图学习等领域。我们希望对推荐、搜索、广告感兴趣的同学,加入我们一起研发世界一流的推荐引擎。 1. 负责推荐算法中台的全链路建设,抽象业务共性,敏捷高效支持各类推荐需求。 2. 负责业界先进推荐算法的研发和落地,包括但不限于大模型技术、多模态内容理解、召回算法、排序模型(粗精排)、长短期兴趣建模、多场景联合建模等。

上海|北京
logo of amap
社招1年以上技术类-地图

部门介绍: 业界领先的地图渲染团队,新一代智能导航的领军者。核心目标是通过导人、导车的产品形态落地,核心技术能力的升级创新,持续为导航、打车、信息、汽车的地图渲染、车道级导航、AI应用提供引擎能力支撑;还有面向未来的云渲染、数字孪生等方向的探索;团队专注地图渲染研发,技术氛围浓厚、追求产品极致,以连接真实世界,服务于广大用户的出行和生活。 部门亮点: ● 车道级导航业界领先,利用几何建模技术,最早实现了人车共导和沉浸式导航。 ● 3D视界,采用游戏化实时渲染技术,结合AI技术,创新性实现了时空互联地图。 ● 顶流产品所需要的渲染技术、图形学、几何建模等业界难题等你来挑战。 岗位职责: 1. 负责3D空间关系构建与建模算法研发; 2. 负责几何图形算法的架构设计与落地; 3. 负责道路数据的精细化渲染研发。

更新于 2025-04-03北京
logo of amap
社招3年以上技术类-算法

团队介绍: 高德地图机器学习研发部是公司AI核心技术引擎,聚焦多模态大模型、视频生成与理解、图像编辑与生成等前沿领域。团队深耕人工智能技术落地,支撑亿级用户产品,同时长期投入前沿探索,在NeurIPS/ICLR/CVPR/ACL等顶会发表多篇论文,多项成果入选“最有影响力论文”榜单。我们拥有海量数据与算力资源,鼓励创新突破,诚邀你与顶尖算法专家并肩,共同定义AI的未来!如果你渴望挑战多模态与生成式AI的技术巅峰,在视频、图像、大模型的交叉领域实现突破,欢迎加入我们!团队的github页面是:https://github.com/AMAP-ML/ 我们提供 • 参与亿级用户产品的AI核心算法研发,见证技术直接赋能业务; • 与学术大牛和工业界专家共事,持续提升技术视野; • 顶配算力资源+开放创新氛围,支持前沿探索与顶会论文发表。 具体职责包括但不限于: 1. 视频生成:负责视频生成技术的前沿技术的研究,对AIGC的diffusion和auto-regressive技术有深入了解,在T2I/AIGCT2V/I2V上面有一定的研究,图文对齐,长视频生成等有一定的研究,做好视频生成在高德业务(广告,POI详情页等)中的进行落地。 2. 视频理解:能够使用和优化多模态大模型对用户上传的视频进行质量理解,标签,densecaption,视频summary等生成,作用到视频的搜索,广告,推荐等业务的落地。 3. 世界模型: 参与世界模型的构建,能够使用最新的视频生成技术,3D技术等构建符合人类物理规律的统一的世界模型,在高德的业务进行落地。 4. 紧跟技术前沿和技术沉淀,形成顶会论文和专利。

更新于 2026-01-23北京