小米自动驾驶多模态大模型算法研发实习生

实习兼职2024-03-01地点：北京状态：招聘

扫码手机上打开

任职要求

1. 2025届硕士及以上学历在读，人工智能、计算机、自动化、数学相关专业优先；
2. 有扩散模型、GAN、ControlNet、LoRA、P-Tuning、NeRF等生成模型使用经验者优先；
3. 熟悉多模态 CLIP 等transformer跨模态表征模型，熟悉 LLaVA、GPT-like、Otter、Sora 等前沿多…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 参与研发前沿大语言模型、多模态大模型、文生3D方向等相关前沿算法，发表国际顶级论文、申请专利
2. 深入调研和关注LLM/VLM/AIGC等方向的前沿技术，重点关注大语言模型和多模态模型Evaluation/SFT/Agent/数据合成技术等相关方向
3. 负责多模态理解&3D生成式等算法，如 LLava、GPT、Otter、StabelDiffusion等系列，包括但不限于图像-文本的多模态对话、多模态标签生成、VQA、多模态任务解析、触发、图像数据编辑及生成等。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Transformer+

GPT+

还有更多 •••

登录查看完整学习资料

相关职位

自动驾驶多模态大模型算法研发实习生（VLA方向）

实习

自动驾驶场景下多模态大模型（VLA：Vision-Language-Action）算法的预研, 包含但不限于： 1. 研究视觉、语言与行为动作之间的联合建模机制，探索多模态预训练与表征学习方法，实现跨模态对齐与融合； 2. 多模态数据集的构建与管理，包括视觉、语言、行为等多模态标签设计与质量控制； 3. 探索模型蒸馏、小样本泛化等技术，推动模型在自动驾驶复杂场景中的部署效率； 4. 跟进并复现前沿研究（如 EMMA、RT-2、OpenVLA等），协助撰写技术报告、论文或专利材料。 5. 深入调研并实践 RLHF / DPO 等对齐技术，提升多模态模型的响应能力与行为决策能力； 6. 撰写高质量的技术文档，参与论文发表或专利申请。

更新于 2025-04-01北京

多模态大模型和语言大模型算法实习生

校招算法序列

1. 参与探索下一代端到端自动驾驶系统的研发； 2. 参与大模型关键技术建设，包括但不限于prompt工程、SFT、对齐及DPO等细分方向； 3. 负责端到端大模型自动驾驶系统的算法研发，包括但不限于多模态大模型、生成式世界模型、Diffusion model等方向； 3. 深入理解自动驾驶的应用场景，参与自动驾驶的数据集收集、整理、标注、管理等；

更新于 2025-05-30北京|上海|深圳

多模态大模型和语言大模型算法实习生

实习算法序列

更新于 2025-05-30北京|上海|深圳

大模型算法工程师

实习菜鸟集团2026

1、自动驾驶多模态算法研究与应用：负责自动驾驶领域的多模态大模型技术研究及算法开发，包括视觉语言模型（VLM）、一段式端到端模型，以及多模态大模型在复杂场景下的技术整合。 2、多模态感知基础模型研究：开展文本（Text）、视觉（Vision）与点云（Point）融合的多模态感知基础模型研究，包括但不限于4D表征、推理（Reasoning）感知、规划等研究方向。 3、视觉-语言-动作（VLA）大模型研究：负责基于视觉-语言-动作（VLA）架构的端到端方案研究，包括数据生产方案、VLA模型架构、效率优化等方向设计与研发。 4、预训练模型研发：研究基于未来帧预测的预训练模型，结合端到端框架设计，探索其在自动驾驶感知、决策与控制闭环中的可行性及性能提升方向。

更新于 2025-05-19杭州