小鹏汽车VLA大模型算法实习生
实习兼职地点:广州 | 上海 | 深圳状态:招聘
任职要求
1、学历与专业: 计算机、自动化、机器人、人工智能、数学等相关专业,硕士及以上学历 2、有端到端自动驾驶(如UniAD)或VLA模型(如RT-2)等在机器人/自动驾驶领域的应用经验; 3、具备良好的数理功底以及代码能力…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责VLA自动驾驶大模型的研发及在车端量产落地等工作; 2、解决VLA在实际量产项目中的问题,基于 Agent 开发自动化问题分析工具; 3、参与构建高质量 VLA Benchmark 系统,包括场景挖掘、难例挖掘及模型评测(Reward Model)等。
包括英文材料
学历+
自动驾驶+
https://www.youtube.com/watch?v=_q4WUxgwDeg&list=PL05umP7R6ij321zzKXK6XCQXAaaYjQbzr
Lecture: Self-Driving Cars (Prof. Andreas Geiger, University of Tübingen)
https://www.youtube.com/watch?v=NkI9ia2cLhc&list=PLB0Tybl0UNfYoJE7ZwsBQoDIG4YN9ptyY
You will learn to make a self-driving car simulation by implementing every component one by one. I will teach you how to implement the car driving mechanics, how to define the environment, how to simulate some sensors, how to detect collisions and how to make the car control itself using a neural network.
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
还有更多 •••
相关职位
实习
1、协助资深工程师进行 VLA 自动驾驶大模型的研发与优化,参与训练数据清洗、标注质量校验、模型微调与对比实验验证工作; 2、协助复现和分析 VLA 模型在城市复杂路况下的行为问题,整理路测日志与实验数据,输出标准化的问题分析报告; 3、参与功能安全方案与安全冗余架构的落地工作,协助梳理安全需求、编写测试用例、执行安全验证测试; 4、协助构建分级指令式云舱平台,开发数据处理、模型测试等辅助工具链,测试平台功能并完善技术文档; 5、参与 VLA 模型的集成与版本交付工作,协助进行版本冒烟测试、问题跟踪与交付文档整理。
更新于 2026-05-28广州
实习算法与软件
1. 负责VLA大模型的端/云基座大模型架构设计与优化、多模态融合训练策略优化; 2. 参与预训练、COT、逻辑推理、数据合成等数据建设与质量提升; 3. 负责模型轻量化能力建设,蒸馏、kvcache压缩、稀疏注意力机制设计与优化; 4. 负责基座大模型核心能力建设,逻辑推理与决策能力、代码能力等。
北京

实习技术类
1. 参与多模态理解与生成大模型、VLA大模型所需的数据清洗和自动标注系统开发,确保各类型/模态数据的质量与多样性,探索高效的数据增强和数据合成方法; 2. 机器人领域大模型的数据采集设计、数据管理、数据质量评测 3. 机器人领域大模型的算法训练,保证模型在多任务、多机器本体的成功应用,机器人大模型训练统一框架的设计 4. 复现并优化主流具身智能范式:如 Diffusion Policy、RT-2、Octo、GR00T、π0、π0.5、πRL等; 5. 将训练好的VLA/VLN模型部署至真实机器人平台
更新于 2025-11-26杭州