小鹏汽车【26届校招】大模型算法工程师
任职要求
1、硕士及以上学历,计算机、数学、人工智能等相关专业; 2、在以下至少一个方向有深入经验:大模型训练(预训练/SFT/RLHF)、多模态模型、强化学习; 3、精通 PyTorch,具备大规模分布式训练实战经验; 4、能独立完成…
工作职责
负责大语言模型和多模态大模型的核心算法研发,推动模型能力在具身智能场景中的落地。 1、大模型预训练、指令微调、偏好对齐(RLHF/GRPO)的算法研发与工程实现,提升模型在推理、规划、工具调用等维度的能力; 2、多模态大模型(VLM/VLA)的研发,探索视觉-语言-动作联合建模,支撑机器人任务规划与交互理解; 3、强化学习算法研究,包括但不限于:过程奖励建模、测试时计算优化(test-time compute)、模型自我进化; 4、将研究成果部署到人形机器人系统(VLT 任务规划、HRI 交互、操作 VLA),完成从论文到产品的闭环。
1.研发业界一流物理AI系统,包括不限于模仿学习, 强化学习, vla, vlm等训练系统与算法架构; 2.参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用; 3.设计和实现机器学习模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。
1.参与自动驾驶系统中机器学习算法的研究、开发与优化,包括但不限于深度学习算法在端到端感知大模型、规控大模型、视觉语言大模型等方面的应用; 2.负责收集、整理和分析自动驾驶相关的数据集,进行数据预处理和标注,以提高模型的准确性和泛化能力; 3.设计和实现机器学习模型的训练流程,包括选择合适的优化算法、调整超参数、评估模型性能等,确保模型在不同场景下的稳定性和可靠性。
1. 负责自动驾驶多模态数据的合成技术研发与工程实现,构建高质量、多样化的仿真与合成数据,提升训练数据的覆盖场景丰富度与边界案例覆盖率,满足端到端自动驾驶模型的训练需求; 2. 深入分析自动驾驶训练数据的特征与分布规律,运用统计建模、机器学习与因果推理方法挖掘数据中的潜在问题(如样本偏差、长尾分布、标签错误、对抗样本等); 3. 研究并开发面向自动驾驶场景的高效自动标签算法,基于规则算法和大模型数据挖掘方法,提升为大模型pretrain,sft,RL阶段提供高质量数据; 4. 构建端到端的数据质量评估与过滤体系,设计适用于自动驾驶任务的数据质量指标(如场景完整性、数据分布合理性、时序一致性、合规性等),开发自动化检测工具链,对标签数据、合成数据开展模型训练,提升模型在安全性,效率,合规,安心感等方面的表现; 5. 持续跟踪自动驾驶与大模型的前沿数据技术,推动数据合成、自动标注、质量评估等核心算法在实际工程系统中的部署与落地。