小鹏汽车VLM Research Intern
任职要求
1、计算机、人工智能、自动化等相关专业硕士及以上学历; 2、具备扎实的深度学习基础,熟悉Transformer、BERT、ViT、CLIP等主流视觉-语言模型架构; 3、有大模型 VLM 的训练/微调/推理优化经验,熟悉其在多模态任务中的应用; 4、熟练使用Pytorch深度学习框架,具备良好的工程能力和代码实现能力; 5、良好的团队协作与沟通能力,具备快速学习和解决问题的能力。 【加分项】 1、有使用大语言模型进行数据合成(Data synthesis)的相关经验; 2、对大语…
工作职责
1、负责大模型 VLM: Vision-Language Model在人形机器人中的算法设计与开发,将VLM应用于人形机器人的对话、环境感知与人机交互任务; 2、参与大模型的Pretrain与Mid-training(long-context training),并利用数据合成技术打造高质量的预训练/后训练数据集; 3、与机器人平台团队、硬件团队紧密协作,实现模型在实际机器人系统中的高效运行; 4、跟踪前沿研究,推动新技术在产品中的落地应用。
1、负责大模型 VLM: Vision-Language Model在人形机器人中的算法设计与开发,将VLM应用于人形机器人的对话、环境感知与人机交互任务; 2、参与大模型的Pretrain与Mid-training(long-context training),并利用数据合成技术打造高质量的预训练/后训练数据集; 3、与机器人平台团队、硬件团队紧密协作,实现模型在实际机器人系统中的高效运行; 4、跟踪前沿研究,推动新技术在产品中的落地应用。
1、负责大模型(LLM: Large Language Model / VLM: Vision-Language Model)在人形机器人中的算法设计与开发,将LLM/VLM应用于人形机器人的对话、环境感知与人机交互任务; 2、参与大模型的Pretrain与Mid-training(long-context training),并利用数据合成技术打造高质量的预训练/后训练数据集; 3、与机器人平台团队、硬件团队紧密协作,实现模型在实际机器人系统中的高效运行; 4、跟踪前沿研究,推动新技术在产品中的落地应用。
· Lead strategic analysis on global trends in Physical AI, including autonomous driving, embodied intelligence, robotics, and sensorimotor foundation models. · Continuously monitor and benchmark key players (e.g., Tesla FSD, Waymo Robotaxi) and emerging technologies in North America and globally. · Conduct exploratory research on cutting-edge technologies related to world models, multimodal large models, and planning frameworks in AI. · Produce high-quality technical and strategic insight reports for internal stakeholders to inform roadmap and business decisions. · Collaborate with R&D and product teams to shape future research directions and support decision-making with clear, data-driven foresight. · Participate in academic engagements, including paper drafting and submission to top-tier AI conferences (e.g., NeurIPS, CVPR, ICRA, RSS).