高德地图世界模型与端到端自动驾驶算法实习生
任职要求
1、计算机科学、人工智能、机器人学等相关专业本科及以上学历,硕士或博士优先。 2、熟悉自动驾驶相关技术(如SLAM、路径规划、强化学习等),有实际项目经验者优先。 3、掌握深度学习框架(如PyTorch、TensorFlow),具备扎实的Python编程能力,熟悉C++者…
工作职责
我们正在寻找对世界模型与端到端自动驾驶技术充满热情的算法实习生,加入我们的前沿技术研发团队。您将专注于端到端自动驾驶算法的研发,推动其在智能驾驶中的落地应用,为用户提供更安全、更高效的出行体验。 主要职责 1、世界模型与建图研发:开发基于多传感器融合的世界模型,实现高精度地图构建与动态场景理解。 2研究基于NeRF、3DGS等技术的三维场景表示方法,提升地图生成的效率与精度。探索语义地图构建技术,结合深度学习实现道路、车道线、交通标志等元素的自动标注与更新。 3、端到端自动驾驶算法研发:研究端到端自动驾驶算法,结合强化学习、模仿学习等技术,实现从感知到决策的全流程优化。开发基于Transformer架构的多模态融合模型,提升自动驾驶系统的鲁棒性。 4、优化端到端模型的推理速度与计算效率,支持实时决策与控制。模型优化与性能提升:针对自动驾驶场景,优化模型的推理速度和资源占用,确保高性能与低延迟。 5、探索适合大模型的压缩与加速技术(如量化、剪枝、知识蒸馏),适配车载硬件平台。 6、前沿技术探索:持续跟踪世界模型、端到端自动驾驶、具身智能等领域的最新技术趋势。提出创新性解决方案,结合业务需求推动技术突破。

职位概览 我们正在寻找对端到端自动驾驶、多模态大模型(VLM/VLA)以及模型高效部署充满热情的同学。你将参与开发下一代智能驾驶算法,重点解决大参数量模型在车规级芯片上的实时运行难题,通过量化、剪枝及训练策略优化,让 AI 更好地理解物理世界并执行驾驶决策。 核心职责 大模型研发与优化:参与视觉语言模型(VLM)或视觉-语言-动作模型(VLA)在自动驾驶场景下的预训练、微调(SFT)及指令遵循能力优化。 量化算法实施:针对 Transformer/Diffusion 等架构,研究并落地先进的量化算法(如 PTQ、QAT、FP8/INT8/INT4 量化),确保模型在有限算力下保持精度。 算法端到端部署:配合工程团队,将复杂的感知或决策模型转化为高效的推理引擎,解决量化掉点、算子融合等实际问题。 前沿技术跟踪:调研并复现相关的顶会论文(CVPR, ICCV, NeurIPS 等),探索大模型在自动驾驶长尾场景(Corner Cases)中的应用。

-前沿算法研发:探索并优化基于神经网络的 4D 重建算法,涵盖动态场景表示、时空一致性建模及大规模前馈推理架构; -核心模型设计:负责数据处理流水线搭建、模型架构演进及训练优化,推动重建精度与泛化能力的突破; -领域技术前瞻:跟踪 3D/4D 视觉与多模态大模型的最新趋势(如 Generative Priors, Large Reconstruction Models),参与技术选型与创新性预研; -全场景落地:协同团队将算法应用于自动驾驶闭环仿真、长尾场景生成等业务逻辑,实现技术闭环。

-前沿算法研发:探索并优化基于神经网络的 4D 重建算法,涵盖动态场景表示、时空一致性建模及大规模前馈推理架构; -核心模型设计:负责数据处理流水线搭建、模型架构演进及训练优化,推动重建精度与泛化能力的突破; -领域技术前瞻:跟踪 3D/4D 视觉与多模态大模型的最新趋势(如 Generative Priors, Large Reconstruction Models),参与技术选型与创新性预研; -全场景落地:协同团队将算法应用于自动驾驶闭环仿真、长尾场景生成等业务逻辑,实现技术闭环。

1.端到端模型研发: 负责新一代 End-to-End 自动驾驶算法的研发,包括但不限于基于 World Model(世界模型)、Video Generation(视频生成) 或 VLM(视觉语言模型) 的驾驶策略生成。 2.模型架构探索: 探索 Transformer、State-space Model (如 Mamba)、Diffusion Model 、IL/RL在轨迹预测与决策规划中的应用,验证 Scaling Law 在自动驾驶规控领域的有效性。 3.数据闭环与评测: 搭建针对生成式规划算法的自动化评测体系,利用大模型进行数据挖掘、自动标注(Auto-labeling)及场景重建,通过数据闭环持续提升模型性能。