小米VLA算法实习生

实习兼职2026-01-06地点：北京状态：招聘

扫码手机上打开

任职要求

1.计算机、人工智能、电子工程、自动化等相关专业硕士及以上学历在读，毕业时间不早于2026年；
2.具备多模态预训练、表征学习或强化学习相关研究经验者优先，熟悉 LLM/VLM/VLA 系列模型架构；
3.有多模态大模型（如 GPT-4V、LLaVA、InterVL、QwenVL）相关背景者优先；
4.熟悉 RLHF、DPO、模型蒸…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

多模态大模型（VLA：Vision-Language-Action）算法的预研, 包含但不限于：
1. 研究视觉、语言与行为动作之间的联合建模机制，探索多模态预训练与表征学习方法，实现跨模态对齐与融合；
2. 多模态数据集的构建与管理，包括视觉、语言、行为等多模态标签设计与质量控制；
3. 探索模型蒸馏、小样本泛化等技术，推动模型在自动驾驶复杂场景中的部署效率；
4. 跟进并复现前沿研究（如 EMMA、RT-2、OpenVLA等），协助撰写技术报告、论文或专利材料。
5. 深入调研并实践 RLHF / DPO 等对齐技术，提升多模态模型的响应能力与行为决策能力；
6. 撰写高质量的技术文档，参与论文发表或专利申请。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

强化学习+

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

VLA算法实习生

实习

多模态大模型（VLA：Vision-Language-Action）算法的预研, 包含但不限于： 1. 研究视觉、语言与行为动作之间的联合建模机制，探索多模态预训练与表征学习方法，实现跨模态对齐与融合； 2. 多模态数据集的构建与管理，包括视觉、语言、行为等多模态标签设计与质量控制； 3. 探索模型蒸馏、小样本泛化等技术，推动模型在自动驾驶复杂场景中的部署效率； 4. 跟进并复现前沿研究（如 EMMA、RT-2、OpenVLA等），协助撰写技术报告、论文或专利材料。 5. 深入调研并实践 RLHF / DPO 等对齐技术，提升多模态模型的响应能力与行为决策能力； 6. 撰写高质量的技术文档，参与论文发表或专利申请。

更新于 2025-11-14上海

VLA算法实习生

实习算法序列

【岗位职责】 -突破时序编码瓶颈：引入 Test-time-training 等技术，实现对物理世界时序信息的高效压缩与编码，在保持性能的同时，将 token 规模与算力开销降至可部署级别。 -构建场景化 VLA 数据体系：基于驾驶场景，构建覆盖空间感知、时序行为、长尾场景与因果推理的结构化数据体系，提升模型对物理世界的理解深度。 -实现实时闭环决策：在车载边缘设备上实现 24FPS 以上的实时推理，让模型从 “被动感知” 进化为 “主动决策”，支撑自动驾驶的长程规划与安全交互。

更新于 2026-03-16北京|上海|香港

VLA算法实习生

校招算法序列

更新于 2026-03-16北京|上海|香港

VLA/VLN算法实习生

实习

1. VLA/VLN算法开发：研究并实现Vision-Language-Action (VLA) / Vision-Language Navigation（VLN）算法，使机器人能够根据自然语言指令以及当前场景进行自主移动； 2. 多模态融合：开发视觉、语言、地图等多模态信息融合模块，提升导航决策的准确性； 3. 场景理解：实现基于视觉和语言的场景语义理解，支持复杂环境下的目标定位与路径规划； 4. 模型训练与优化：负责VLA/VLN模型的训练、调优及推理性能优化； 5. 数据与评测：参与导航数据集构建、评测指标设计及Benchmark开发。

更新于 2025-12-01深圳