小鹏汽车【26届校招】大模型算法工程师

校招全职2026-04-10地点：深圳 | 北京 | 上海状态：招聘

扫码手机上打开

任职要求

1、硕士及以上学历，计算机、数学、人工智能等相关专业；
2、在以下至少一个方向有深入经验：大模型训练（预训练/SFT/RLHF）、多模态模型、强化学习；
3、精通 PyTorch，具备大规模分布式训练实战经验；
4、能独立完成…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

负责大语言模型和多模态大模型的核心算法研发，推动模型能力在具身智能场景中的落地。
1、大模型预训练、指令微调、偏好对齐（RLHF/GRPO）的算法研发与工程实现，提升模型在推理、规划、工具调用等维度的能力；
2、多模态大模型（VLM/VLA）的研发，探索视觉-语言-动作联合建模，支撑机器人任务规划与交互理解；
3、强化学习算法研究，包括但不限于：过程奖励建模、测试时计算优化（test-time compute）、模型自我进化；
4、将研究成果部署到人形机器人系统（VLT 任务规划、HRI 交互、操作 VLA），完成从论文到产品的闭环。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

大模型+

SFT+

RLHF+

强化学习+

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

【26届校招】大语言模型数据算法工程师

校招

我们正在寻找对大语言模型(Large Language Model,LLM)充满热情的数据算法工程师,加入我们的核心AI团队。你将主要负责LLM高质量与大规模数据的采集与处理，并参与从LLM预训练、微调、推理优化到多场景应用落地的全流程工作，推动LLM技术在对话系统、内容生成、知识推理、具身智能等领域的创新 1. 主导LLM数据的采集和处理，搭建高效的数据处理 Pipeline，实现从海量原始数据到可直接驱动模型训练的高质量数据的转化。 2. 打造并优化数据平台的核心模块（包括处理、标注、对齐、存储与可视化），确保数据的可追溯性与可验证性。 3. 参与大模型从预训练到后训练的全链路流程，深入分析模型对数据的敏感点，通过数据迭代持续提升模型能力。 4. 紧跟全球前沿技术动态，研究并引入最新的数据集与标准，将优秀的开源经验转化为团队的核心优势，持续扩展数据版图。

更新于 2025-10-14上海

【26届校招】大语言模型预训练算法工程师

校招

我们正在寻找对大语言模型（LLM）的底层原理、性能优化和高效预训练充满热情的顶级算法工程师。您将加入我们的核心研发团队，主要负责LLM预训练阶段的算法设计、优化与实现，包括模型架构的探索、训练稳定性的提升、大规模分布式训练的优化等。我们的目标是基于业务需求，设计并训练对硬件计算友好的语言模型，从根本上突破模型的性能和训练效率极限，加速LLM在人形机器人、自动驾驶、多模态等前沿领域的落地。工作职责： 1. LLM预训练算法研发与实现：主导1~7B参数级别的Dense以及MoE Transformer模型以及其他前沿架构在预训练阶段的设计、实验与优化，以提升模型的基础能力和效率。 2. 基准测试与性能优化：负责模型训练过程中的关键性能指标监测与优化，特别是MMLU, GSM8K, MATH等常见标准化测试的表现。通过算法迭代，持续提高模型在理解、推理和泛化能力方面的分数。 3. 训练稳定性与效率提升：负责分析和解决超大规模训练过程中的数值不稳定、梯度爆炸/消失等问题，引入和实现如混合精度训练、梯度裁剪、学习率调度等优化策略。 4. 前沿技术追踪与转化：紧密追踪全球LLM预训练、Scaling Law、新型优化器（如AdamW、Lion）等最新研究进展，评估并将业界顶尖的算法创新快速转化为我们的核心竞争力。 5. 跨团队协作：与数据工程师紧密合作，分析数据对预训练效果的影响，并与系统/硬件工程师协作，共同调优底层计算资源以实现最高训练吞吐。

更新于 2025-10-15上海|深圳

大模型算法（26 届校招）(J11984)

校招

1、负责 AI 健身教练和 AI 营养师的落地； 2、理解当前大模型的能力边界，并根据业务需求进行针对性的优化和调整； 3、设计并优化大模型的训练流程、微调策略和推理效率，提高模型的效果、效率和稳定性； 4、深入融合多模态技术（如文本、图像、语音和视频）于用户交互体验中，构建智能、高效且人性化的互动系统； 5、与产品和工程团队紧密合作，推动 AI 相关功能的产品化落地，根据用户反馈快速迭代改进模型； 6、持续关注大模型领域的前沿研究，探索新的应用方向和技术方案，将创新想法融入产品。

更新于 2025-09-10北京

【26届校招】大模型平台 & Infra工程师

校招

负责大模型训练、推理和评测的基础设施研发，为算法团队提供高效稳定的工程底座。 1、训练系统：设计和优化大规模分布式训练架构（Pretrain/SFT/RL），解决千卡级训练的通信、调度、容错问题； 2、推理部署：基于 vLLM 等框架优化大模型推理性能，支撑 VLT/Omni 等模型在 XP5 端侧和云端的部署； 3、评测平台：开发 DeepInsight 评测系统，支持 LLM/VLM/WBC/VLA 多类模型的自动化评测、报告生成和 CI/CD 集成； 4、MLOps 工具链：构建模型版本管理、实验追踪、数据管理、资源调度等基础设施，提升研发效率； 5、RL 训练环境：构建分布式强化学习训练系统，支持 Agent-环境大规模并行交互。

更新于 2026-04-10深圳|北京|上海