高德地图世界模型与端到端自动驾驶算法实习生
任职要求
1、计算机科学、人工智能、机器人学等相关专业本科及以上学历,硕士或博士优先。 2、熟悉自动驾驶相关技术(如SLAM、路径规划、强化学习等),有实际项目经验者优先。 3、掌握深度学习框架(如PyTorch、TensorFlow),具备扎实的Python编程能力,熟悉C++者…
工作职责
我们正在寻找对世界模型与端到端自动驾驶技术充满热情的算法实习生,加入我们的前沿技术研发团队。您将专注于端到端自动驾驶算法的研发,推动其在智能驾驶中的落地应用,为用户提供更安全、更高效的出行体验。 主要职责 1、世界模型与建图研发:开发基于多传感器融合的世界模型,实现高精度地图构建与动态场景理解。 2研究基于NeRF、3DGS等技术的三维场景表示方法,提升地图生成的效率与精度。探索语义地图构建技术,结合深度学习实现道路、车道线、交通标志等元素的自动标注与更新。 3、端到端自动驾驶算法研发:研究端到端自动驾驶算法,结合强化学习、模仿学习等技术,实现从感知到决策的全流程优化。开发基于Transformer架构的多模态融合模型,提升自动驾驶系统的鲁棒性。 4、优化端到端模型的推理速度与计算效率,支持实时决策与控制。模型优化与性能提升:针对自动驾驶场景,优化模型的推理速度和资源占用,确保高性能与低延迟。 5、探索适合大模型的压缩与加速技术(如量化、剪枝、知识蒸馏),适配车载硬件平台。 6、前沿技术探索:持续跟踪世界模型、端到端自动驾驶、具身智能等领域的最新技术趋势。提出创新性解决方案,结合业务需求推动技术突破。

3D视觉方向【base地:上海/北京/南京】 1、负责面向端到端驾驶环境感知前沿算法的研发工作,包括不限于目标检测、语义分割、目标跟踪,深度估计,重建、世界模型等; 2、负责面向端到端自动驾驶多传感器(包括不限于视觉/Lidar/Radar)融合感知算法的探索与研发; 3、负责研究自动驾驶场景中端到端感知任务的模型的优化; 4、负责计算机视觉领域前沿技术中网络模型分析和研究工作;
一、团队介绍 高德视觉技术中心为高德业务提供全面的核心视觉技术,是高德时空互联网领域重要的技术驱动力。我们专注于图像识别、点云识别、三维重建和传感器融合定位等领域, 我们致力于研究和开发业内领先的感知、SLAM、重建和多模态大模型等算法, 促科技创新,与生态共进,连接真实世界,做好一张活地图,让出行和生活更美好! 通过视觉技术中心的春季实习生项目,高校学生通过此项目可以接触到高德真实的业务场景和海量时空大数据,在优秀的前辈与高德技术人交流学习中加速成长。我们希望更多优秀的高校同学加入我们,一起打造极致的算法和产品体验。 二、基本要求 面向预期于26、27届毕业的同学,可以连续实习至少三个月的同学优先。实习地点:北京,我们将提供有竞争力的实习薪酬和充足的训练资源。 三、算法实习生 职位描述 团队主要聚焦视觉、矢量地图、多模态大模型技术,我们期待你的工作将覆盖以下至少一个技术方向: 1. 探索自动驾驶场景下的在线感知、建图、关联等前沿技术,包括但不限于矢量地图构建、矢量地图关联等; 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等;
一、团队介绍 高德视觉技术中心为高德业务提供全面的核心视觉技术,是高德时空互联网领域重要的技术驱动力。我们专注于图像识别、点云识别、三维重建和传感器融合定位等领域, 我们致力于研究和开发业内领先的感知、SLAM、重建和多模态大模型等算法, 促科技创新,与生态共进,连接真实世界,做好一张活地图,让出行和生活更美好! 通过视觉技术中心的春季实习生项目,高校学生通过此项目可以接触到高德真实的业务场景和海量时空大数据,在优秀的前辈与高德技术人交流学习中加速成长。我们希望更多优秀的高校同学加入我们,一起打造极致的算法和产品体验。 二、基本要求 面向预期于26、27届毕业的同学,可以连续实习至少三个月的同学优先。实习地点:北京,我们将提供有竞争力的实习薪酬和充足的训练资源。 三、算法实习生 职位描述 团队主要聚焦视觉、矢量地图、多模态大模型技术,我们期待你的工作将覆盖以下至少一个技术方向: 1. 探索自动驾驶场景下的在线感知、建图、关联等前沿技术,包括但不限于矢量地图构建、矢量地图关联等; 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等;
加入我们,驱动自动驾驶的未来! 现正积极招募对大模型技术充满热情的实习生。如果你对VLM(视觉语言模型)、VLA(视觉语言动作模型)、世界模型、视频生成或强化学习有浓厚兴趣或研究经验,欢迎加入我们,共同探索自动驾驶技术的边界! 职位亮点 • 前沿技术探索:深入参与多模态大模型、生成式世界模型、强化学习等尖端技术在自动驾驶领域的应用研究 • 全流程实践:从数据构建、模型设计、训练优化到评测部署,全面参与自动驾驶大模型的研发全流程 • 丰富资源支持:提供大规模真实驾驶场景数据集与充足计算资源,支持技术创新与突破 • 成果转化与发表:开放的技术氛围,支持顶会论文发表与专利申请,优秀成果有望落地应用 • 参与VLA/VLM算法研发,探索视觉-语言-动作模型在自动驾驶决策规划中的应用 • 开展生成式世界模型研究,包括状态建模、轨迹预测与端到端规划 • 运用强化学习/模仿学习技术,提升模型在复杂驾驶场景的应对能力 • 构建多模态预训练与SFT数据集,优化模型泛化性与鲁棒性 • 跟踪顶级会议最新研究成果,复现开源项目并进行技术验证