logo of amap

高德地图高德-资深生成式大模型算法专家-北京(急招)-视觉技术中心

社招全职3年以上技术类-算法地点:北京状态:招聘

任职要求


具备其中任一模块能力即可
1、熟悉生成模型理论,熟悉AIGC算法,包括但不限于基于扩散模型的文生视频、视频增强等。掌握 VAE / Diffusion / AR 等至少一种生成算法方案,有论文或成熟项目落地经验;
2、有大规模分布式机器学习系统研发背景,具备分布式训练(DeepSpeed/Megatron-LM/Horovod 等)实践经验;
3、精通 SFTRLHF(PPO/奖励模型等)技术,能在大模型后训练阶段…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责基于扩散模型的世界生成、视频生成等相关场景的算法研发工作,结合实际应用场景攻克技术难题,包括世界生成过程中的可控性、时空一致性、实时性等问题;
2、参与并主导生成式大模型核心算法研发,包括 Diffusion、Autoregressive(AR)、VAE、Transformer 等架构。研发时空视频编码、压缩与生成算法,优化模型在生成任务中的一致性与时序表现。设计并实现从预训练到后训练(SFT、RLHF)的全流程模型优化方案,提升生成质量、可控性和效率;
3、负责生成式大模型的总体技术架构设计,探索多模态融合、跨任务迁移等创新方向,跟踪前沿研究进展,进行技术评估与落地转化,推动团队在行业/学术上的技术领先。
包括英文材料
AIGC+
算法+
机器学习+
DeepSpeed+
Megatron+
SFT+
RLHF+
还有更多 •••
相关职位

logo of amap
社招4年以上技术类-算法

我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 团队主要聚焦多模态大模型技术在端到端自动驾驶的应用,我们期待你的工作将覆盖以下至少一个技术方向即可: 1. 在端到端自动驾驶、多模态大模型的训练及调优、BEV感知、基于深度学习/强化学习的规划控制、RLHF、驾驶场景视频生成等领域具备丰富且有独创性的研究经历。 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等。 3. 了解大模型模型的训练/微调/推理加速方法,包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理,模型部署加速等。 4. 参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用。 5. 负责收集、整理和分析自动驾驶相关的数据集,进行数据预处理和标注,以提高模型的准确性和泛化能力。 6. 设计和实现端到端自动驾驶模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。

更新于 2025-12-24北京
logo of amap
社招4年以上技术类-算法

我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 1、负责研发空间智能核心技术,进行室内/室外/航拍/卫片等全场景高质量空间理解、重建与生成,包括但不限于基于图像、视频、点云、Mesh和3DGS等多种模态数据的空间智能基座与应用; 2、负责多模态大模型和视频生成大模型的预训练、微调等工作,包括但不限于数字人、生成式重建及空间生成等应用方向; 3、负责大规模多模态数据集的构建、清洗与管理,搭建高效数据流水线,保障算法训练与评估; 4、负责结合具体需求,抽象出关键算法进行研发,并持续保持及引领相关技术指标。

更新于 2025-11-14北京
logo of amap
社招5年以上技术类-算法

团队介绍: 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕,更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。 作为高德地图的核心技术驱动部门,我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心,推动智能出行与真实世界连接的深度融合。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 我们正在寻找对多模态技术充满热情的算法工程师,加入我们的研发团队。您将专注于多模态理解与生成,推动其在高德扫街榜等热门应用中落地,为用户提供更智能、更沉浸的服务。 主要职责: 1、多模态大模型研发:开发业界领先的图文多模态大模型,实现高质量场景理解和内容生成; 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等); 3、业务场景落地:将多模态技术应用于扫街榜等实际业务场景,与产品、工程团队合作,推动技术从研发到上线的全流程落地; 4、前沿技术探索:持续跟踪生成式AI、跨模态对齐、思维链、强化学习、多模态交互等最新技术趋势,提出创新性解决方案。

更新于 2026-02-03北京
logo of xpeng
社招

【岗位描述】 设计和实现计算机视觉系统。此视觉系统将用于实现包括但不限于车内人员与物体的检测和属性划分;人员的动作和行为的理解与分析,危险动作和场景的预警;车内气氛状态的感知等。 1、模型与算法设计:基于最先进的机器学习和神经网络方法算法,开发多模态(图像、视频、文本)模型。 2、创建训练所需的数据集;并根据模型表现以及功能需求,动态筛选、整理与适配数据。 3、实施和优化大模型的分布式训练,提高模型训练的效率和性能。 4、根据相应任务,构建合理的测试数据集,测试视觉语言模型的KPI。 5、与模型部署团队进行沟通,协助模型的转化和部署。 6、实时跟进学术界前沿算法,升级改进数据生成算法与软件。 7、跨团队跨部门沟通协作。

更新于 2025-04-23北京