logo of xpeng

小鹏汽车自动驾驶大模型实习生招聘(北京/广州/上海/深圳)

实习兼职地点:广州 | 上海 | 北京 | 深圳状态:招聘

任职要求


硕士及以上学历,计算机、人工智能、机器人等相关专业
• 熟悉深度学习算法,对CV、NLP、多模态等领域有深入理解
• 熟练掌握Python/C++,精通PyTorch等深度学习框架,有较强工程能力
• 具备以下至少一个方向经验者优先:
◦ VLA/VLM模型:熟悉Transformer、Dif…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


加入我们,驱动自动驾驶的未来!
现正积极招募对大模型技术充满热情的实习生。如果你对VLM(视觉语言模型)、VLA(视觉语言动作模型)、世界模型、视频生成或强化学习有浓厚兴趣或研究经验,欢迎加入我们,共同探索自动驾驶技术的边界!
职位亮点
• 前沿技术探索:深入参与多模态大模型、生成式世界模型、强化学习等尖端技术在自动驾驶领域的应用研究
• 全流程实践:从数据构建、模型设计、训练优化到评测部署,全面参与自动驾驶大模型的研发全流程
• 丰富资源支持:提供大规模真实驾驶场景数据集与充足计算资源,支持技术创新与突破
• 成果转化与发表:开放的技术氛围,支持顶会论文发表与专利申请,优秀成果有望落地应用

• 参与VLA/VLM算法研发,探索视觉-语言-动作模型在自动驾驶决策规划中的应用
• 开展生成式世界模型研究,包括状态建模、轨迹预测与端到端规划
• 运用强化学习/模仿学习技术,提升模型在复杂驾驶场景的应对能力
• 构建多模态预训练与SFT数据集,优化模型泛化性与鲁棒性
• 跟踪顶级会议最新研究成果,复现开源项目并进行技术验证
包括英文材料
学历+
深度学习+
算法+
NLP+
Python+
C+++
还有更多 •••
相关职位

logo of momenta
实习

1、负责高校重点实验室Mapping, 协助建立AI大模型领域校招人才地图、跟踪目标院校实验室(如大模型/自动驾驶方向)、顶尖学生论文/竞赛情况; 2、负责重点大模型算法岗位的社招、校招及实习生招聘,辅助部分行业定向高招Sourcing工作; 3、快速响应业务的实习需求,完成岗位发布与主动寻访,独立负责实习生招聘交付; 4、提供高效的人力资源日常运营支持(数据分析、材料整理、信息搜寻、文化活动等); 5、团队的其他工作支持。

更新于 2025-07-17北京
logo of amap
实习高德地图2026

一、团队介绍 高德视觉技术中心为高德业务提供全面的核心视觉技术,是高德时空互联网领域重要的技术驱动力。我们专注于图像识别、点云识别、三维重建和传感器融合定位等领域, 我们致力于研究和开发业内领先的感知、SLAM、重建和多模态大模型等算法, 促科技创新,与生态共进,连接真实世界,做好一张活地图,让出行和生活更美好! 通过视觉技术中心的春季实习生项目,高校学生通过此项目可以接触到高德真实的业务场景和海量时空大数据,在优秀的前辈与高德技术人交流学习中加速成长。我们希望更多优秀的高校同学加入我们,一起打造极致的算法和产品体验。 二、基本要求 面向预期于26、27届毕业的同学,可以连续实习至少三个月的同学优先。实习地点:北京,我们将提供有竞争力的实习薪酬和充足的训练资源。 三、算法实习生 职位描述 团队主要聚焦视觉、矢量地图、多模态大模型技术,我们期待你的工作将覆盖以下至少一个技术方向: 1. 探索自动驾驶场景下的在线感知、建图、关联等前沿技术,包括但不限于矢量地图构建、矢量地图关联等; 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等;

更新于 2025-03-31北京
logo of momenta
实习软件工程

1.研发基于多传感器(激光雷达、摄像头等)的4D时空场景重建和生成算法,融合时序信息实现动态物体和静态场景高精度建模; 2.研发场景生成、可交互视频生成等技术,支持自动驾驶场景的高保真场景生成,用于端到端自动驾驶算法的闭环仿真和强化学习训练; 3.结合闭环仿真结果,对场景生成相关算法进行迭代,推动端到端自动驾驶系统的联合优化。

更新于 2025-10-11北京|苏州|上海
logo of cainiao
实习菜鸟集团2026

1、自动驾驶多模态算法研究与应用:负责自动驾驶领域的多模态大模型技术研究及算法开发,包括视觉语言模型(VLM)、一段式端到端模型,以及多模态大模型在复杂场景下的技术整合。 2、多模态感知基础模型研究:开展文本(Text)、视觉(Vision)与点云(Point)融合的多模态感知基础模型研究,包括但不限于4D表征、推理(Reasoning)感知、规划等研究方向。 3、视觉-语言-动作(VLA)大模型研究:负责基于视觉-语言-动作(VLA)架构的端到端方案研究,包括数据生产方案、VLA模型架构、效率优化等方向设计与研发。 4、预训练模型研发:研究基于未来帧预测的预训练模型,结合端到端框架设计,探索其在自动驾驶感知、决策与控制闭环中的可行性及性能提升方向。

更新于 2025-05-19杭州