小鹏汽车【26届校招】VLM/VLA 大模型算法工程师
校招全职地点:深圳状态:招聘
任职要求
任职要求: - 计算机、人工智能、自动化等相关专业硕士及以上学历; - 具备扎实的深度学习基础,熟悉 Transformer、BERT、ViT、CLIP、BLIP 等主流视觉-语言模型架构; - 有大模型(VLM、LLM)训练/推理优化经验,熟悉其在多模态任务中的应用; - 有 VLA 建模、生成式模型(如diffusion)、多模态强化学习相关项目背景; - 熟练使用 PyTorch、TensorFlow 等深度学…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
- 负责多模态大模型(VLM: Vision-Language Model / VLA: Vision-Language-Action Model)在人形机器人中的算法设计与开发,将VLM/VLA 应用于人形机器人的智能操作与人机交互任务; - 参与大模型的预训练、后训练(SFT + RL)及部署工作,支持机器人在复杂环境下的感知与行为能力; - 与机器人平台团队、硬件团队紧密协作,实现模型在实际机器人系统中的高效运行; - 跟踪前沿研究,推动新技术在产品中的落地应用。
包括英文材料
学历+
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
BERT+
https://www.youtube.com/watch?v=xI0HHN5XKDo
Understand the BERT Transformer in and out.
还有更多 •••
相关职位
校招
1.研发业界一流物理AI系统,包括不限于模仿学习, 强化学习, vla, vlm等训练系统与算法架构; 2.参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用; 3.设计和实现机器学习模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。
更新于 2025-07-01北京
校招
打造行业领先的原生具身智能大模型,如VLM/VLA/World Model/Omni。面向通用人形机器人及更广泛的具身场景,构建可泛化、可拓展、可scaling的大模型,负责大规模训练性能与效果优化。 职位要求: 1、计算机、电子工程、人工智能等相关领域硕士及以上学历; 2、具有扎实的机器学习算法基础,在VLM、LLM、AIGC、RL、Robotics、Audio 等相关专业领域有研究经验; 3、具有优秀的代码能力,精通PyTorch/TensorFlow等深度学习框架,熟悉大规模训练栈:大规模训练框架,加速方法; 4、具有良好的团队合作能力和沟通能力。
更新于 2025-10-30深圳|上海|北京
校招
1、面向通用人形机器人,打造行业领先的具身大模型,实现全身动作控制、场景及任务可泛化的、可scaling的VLA大模型研究,形成持续的技术影响力并引领国际行业发展。
更新于 2025-08-21深圳|上海|北京