地平线视觉深度学习算法实习生（VLA静态要素理解方向）

实习兼职算法序列2025-09-28地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1、计算机视觉、模式识别、机器学习、电子信息、机器人等相关专业的硕士/博士在读；
2、熟悉主流深度学习算法，精通一/多个领域，包括但不限于目标检测、分割、跟踪、多任务学习、立体视觉等领域，有计算机视觉、模式识别领域顶会；（CVPR/ICCV/ECCV/ICML/NeurIPS）或顶刊（TPAMI/IJCV/TIP）作品者优先；顶级学术…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、探索vla模型在复杂路口的场景理解能力以及对下游决策模块的提升；
2、负责核心算法或模型的原创设计以及工程化落地，如模型优化、评测体系化构建、case迭代等；
3、掌握数据挖掘、标注、训练、部署及badcase回归等闭环链路，并伴随业务开展持续优化；
4、掌握通过数据闭环持续迭代模型的能力；

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

OpenCV+

模式识别+

机器学习+

深度学习+

算法+

CVPR+

ICCV+

ECCV+

还有更多 •••

登录查看完整学习资料

相关职位

具身智能算法实习生

实习核心本地商业-基

深度参与具身智能“感知-决策-行动”技术全链路的技术攻关，在以下一个或多个方向上进行深入研究： 1. 感知与决策规划：提升多模态大模型在具身场景下的能力表现，包括在复杂动态环境中对环境的空间理解，以及对复合任务的任务步骤拆解与任务状态判断能力。 2. 行动与控制：基于真机示教数据、增广数据以及海量互联网视频数据，训练机器人掌握高精度的操作技能。在机器人上研究并实践强化学习算法，优化机器人的动作策略，提升其在物理世界中的动作鲁棒性和技能泛化。 3. 数据增广：通过仿真和world model等方式对真机遥操数据进行规模化增广，探索如何解决真机遥操数据的稀缺问题。

更新于 2025-12-25北京|上海

VLA/VLN算法实习生

实习

1. VLA/VLN算法开发：研究并实现Vision-Language-Action (VLA) / Vision-Language Navigation（VLN）算法，使机器人能够根据自然语言指令以及当前场景进行自主移动； 2. 多模态融合：开发视觉、语言、地图等多模态信息融合模块，提升导航决策的准确性； 3. 场景理解：实现基于视觉和语言的场景语义理解，支持复杂环境下的目标定位与路径规划； 4. 模型训练与优化：负责VLA/VLN模型的训练、调优及推理性能优化； 5. 数据与评测：参与导航数据集构建、评测指标设计及Benchmark开发。

更新于 2025-12-01深圳

VLA算法实习生

实习算法与软件

1.负责理想汽车VLA模型方法研发和工程落地，包括但不限于视觉多模态理解、高级指令拆解及多模态policy预测; 2.负责设计高性能上限，具备量产能力的VLA模型算法，对包括但不限于diffusion、VLM等模型算法有实操经验； 3.开发高效离线训练框架，以及可实时运行的在线推理框架，优化模型推理性能，研发模型部署工具链和优化工具； 4.建立云端数据感知/决策联合标注Pipeline、数据挖掘机制以及难样本分析等工具链，通过数据闭环持续选代模型能力。

北京

元萝卜-机器人算法实习生(VLA方向)

实习技术族-实习

1、模型复现与实现：复现当前主流的开源VLA模型(如GR00T/ π0.5/SmoIVLA/WALL-OSS等)，确保算法正确性和性能。 2、系统集成与测试：将VLA模型集成到公司机器人平台，设计并执行测试方案，评估模型在真实环境中的感知、推理与执行能力。 3、算法优化与创新：针对机器人具体应用场景，对VLA模型进行微调、优化及创新，提升其在复杂环境下的适应性和鲁棒性。 4、多模态数据处理：处理视觉、语言和动作数据，构建和优化训练数据集，支持模型的训练和评估。 5、技术跟踪与报告：跟踪VLA领域的最新研究进展，撰写技术报告，并参与团队技术讨论与分享。

更新于 2025-11-03北京