高德地图高德-多模态大模型/端到端自动驾驶算法工程师/专家-视觉团队
任职要求
1. 自然语言处理、计算机视觉、人工智能等相关专业的硕士生/博士生,对发文章有兴趣,具备良好的英文写作能力; 2. 发表过CV&AI顶会论文优先,ACM编程竞赛、数据建模竞赛等竞赛获奖优先。 3. 动手实现能力强,代码基本功扎实,精通基于Python的算法开发;熟练掌握pytorch/tensorflow/mxnet等至少一项深度学习框架。 4. 自驱力强、充满好奇心、团队合作、沟通能力佳。 我们需要这样的你 -有对于AGI的技术追求,对于前沿技术有浓厚兴趣,坚信AI驱动产品与业务创新 -有扎实的算法基础和动手能力,包含但不限于模型的训练、推理和部署等方面 -在大模型、多模态、AIGC、三维几何、自动驾驶、机器人等方面有丰富的项目经验
工作职责
我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 团队主要聚焦多模态大模型技术在端到端自动驾驶的应用,我们期待你的工作将覆盖以下至少一个技术方向即可: 1. 在端到端自动驾驶、多模态大模型的训练及调优、BEV感知、基于深度学习/强化学习的规划控制、RLHF、驾驶场景视频生成等领域具备丰富且有独创性的研究经历。 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等。 3. 了解大模型模型的训练/微调/推理加速方法,包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理,模型部署加速等。 4. 参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用。 5. 负责收集、整理和分析自动驾驶相关的数据集,进行数据预处理和标注,以提高模型的准确性和泛化能力。 6. 设计和实现端到端自动驾驶模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。
我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 团队主要聚焦多模态大模型技术在端到端自动驾驶的应用,我们期待你的工作将覆盖以下至少一个技术方向即可: 1. 在端到端自动驾驶、多模态大模型的训练及调优、BEV感知、基于深度学习/强化学习的规划控制、RLHF、驾驶场景视频生成等领域具备丰富且有独创性的研究经历。 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等。 3. 了解大模型模型的训练/微调/推理加速方法,包括但不限于模型结构调优、训练效率提升、高效低成本微调、Muti-token推理,模型部署加速等。 4. 参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用。 5. 负责收集、整理和分析自动驾驶相关的数据集,进行数据预处理和标注,以提高模型的准确性和泛化能力。 6. 设计和实现端到端自动驾驶模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。

- 定义和主导端到端自动驾驶算法的长期技术路线图,负责从模型架构(如Transformer、Diffusion Model等)选型到整体方案设计的关键决策。 - 深入一线,解决研发过程中最棘手的技术难题,如长尾场景处理、模型收敛性、部署效率等。 - 推动端到端模型在量产项目中的评估、测试和部署,对最终的产品性能和用户体验负责。 - 负责招聘、组建并领导一支世界级的端到端算法团队,营造开放、创新、高效的研发氛围。
工作城市可选北京、深圳 1.端到端自动驾驶建模:参与、设计及实现端到端的自动驾驶建模方法,搭建从传感器数据到行为决策的端到端模型。 2.多模态大模型在自动驾驶场景中的适配和优化:如:大模型指令微调和策略迭代、开放场景下的目标识别技术等,以适应不同的自驾场景,并提高模型的鲁棒性和泛化能力。 3.生成式仿真系统构建,研发基于扩散模型的场景生成技术和仿真技术。开发仿真-真实数据闭环系统。