logo of liauto

理想汽车VLA算法实习生

实习兼职算法与软件地点:北京状态:招聘

任职要求


1.有自动驾驶或具身智能项目经验,熟悉感知/规划方法,有具身智能研发和部署经验者优先;
2.应用数学、模式识别机器学习、电子信息、机器人等相关专业业的硕士/博士或者同等工作经验;
3.熟悉当前主流的深度学习算法,精通一个或多个领域算法研究,包括但不限于目标检测、图神经网络、NLP大模型等领域;
4.深入…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责理想汽车VLA模型方法研发和工程落地,包括但不限于视觉多模态理解、高级指令拆解及多模态policy预测;
2.负责设计高性能上限,具备量产能力的VLA模型算法,对包括但不限于diffusion、VLM等模型算法有实操经验;
3.开发高效离线训练框架,以及可实时运行的在线推理框架,优化模型推理性能,研发模型部署工具链和优化工具;
4.建立云端数据感知/决策联合标注Pipeline、数据挖掘机制以及难样本分析等工具链,通过数据闭环持续选代模型能力。
包括英文材料
自动驾驶+
模式识别+
机器学习+
深度学习+
算法+
NLP+
大模型+
数据结构+
还有更多 •••
相关职位

logo of mi
实习

多模态大模型(VLA:Vision-Language-Action)算法的预研, 包含但不限于: 1. 研究视觉、语言与行为动作之间的联合建模机制,探索多模态预训练与表征学习方法,实现跨模态对齐与融合; 2. 多模态数据集的构建与管理,包括视觉、语言、行为等多模态标签设计与质量控制; 3. 探索模型蒸馏、小样本泛化等技术,推动模型在自动驾驶复杂场景中的部署效率; 4. 跟进并复现前沿研究(如 EMMA、RT-2、OpenVLA等),协助撰写技术报告、论文或专利材料。 5. 深入调研并实践 RLHF / DPO 等对齐技术,提升多模态模型的响应能力与行为决策能力; 6. 撰写高质量的技术文档,参与论文发表或专利申请。

更新于 2025-11-14上海
logo of xpeng
实习

1. 参与人形机器人Vision-Language-Action (VLA)算法的研发,包括数据采集、模型训练与部署、多模态大模型在机器人操作任务中的应用; 2. 负责机器人动力学建模、轨迹优化、实时运动规划算法开发与调优; 3. 探索VLA模型与传统运动规划算法(RRT、轨迹优化、MPC等)的结合方式; 4. 跟踪Learning for Planning / Planning for Learning领域最新进展,推动技术创新; 5. 参与机器人数据集的构建、清洗与标注流程优化;

更新于 2025-12-01深圳
logo of mi
实习

1. 负责研发基于机器人作业场景的重建/生成/编辑等功能 Modeling the 3D Physical World for Embodied AI. 2. 负责机器人仿真器环境部署、算法训练开发,算法真机部署,实现仿真算法Sim2Real的zero-short迁移。 3. 负责vlm,vla机器人基座大模型数据生产,模型训练,验证等。

更新于 2025-05-15北京
logo of xpeng
实习

1. VLA/VLN算法开发:研究并实现Vision-Language-Action (VLA) / Vision-Language Navigation(VLN)算法,使机器人能够根据自然语言指令以及当前场景进行自主移动; 2. 多模态融合:开发视觉、语言、地图等多模态信息融合模块,提升导航决策的准确性; 3. 场景理解:实现基于视觉和语言的场景语义理解,支持复杂环境下的目标定位与路径规划; 4. 模型训练与优化:负责VLA/VLN模型的训练、调优及推理性能优化; 5. 数据与评测:参与导航数据集构建、评测指标设计及Benchmark开发。

更新于 2025-12-01深圳