小鹏汽车大语言模型数据算法实习生

实习兼职2025-10-15地点：深圳 | 上海状态：招聘

扫码手机上打开

任职要求

1. 计算机、人工智能、自动化等相关专业硕士及以上学历。
2. 具备处理和构建LLM数据集的实际经验，熟悉LLM领域常用数据集（如DCLM、Fineweb等），掌握常用的数据处理与清洗方法。
3. 熟悉Transformer、GPT系列、LLaMA、GLM等主流模型架构，深入理解训练数据在模型训练中的作用与影响。
4. 熟练掌握Python编程语言，熟练使用PyTorch深度学习框…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

我们正在寻找对大语言模型(Large Language Model,LLM)充满热情的数据算法工程师,加入我们的核心AI团队。你将主要负责LLM高质量与大规模数据的采集与处理，并参与从LLM预训练、微调、推理优化到多场景应用落地的全流程工作，推动LLM技术在对话系统、内容生成、知识推理、具身智能等领域的创新

1. 主导LLM数据的采集和处理，搭建高效的数据处理 Pipeline，实现从海量原始数据到可直接驱动模型训练的高质量数据的转化。
2. 打造并优化数据平台的核心模块（包括处理、标注、对齐、存储与可视化），确保数据的可追溯性与可验证性。
3. 参与大模型从预训练到后训练的全链路流程，深入分析模型对数据的敏感点，通过数据迭代持续提升模型能力。
4. 紧跟全球前沿技术动态，研究并引入最新的数据集与标准，将优秀的开源经验转化为团队的核心优势，持续扩展数据版图。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

大模型+

Transformer+

GPT+

还有更多 •••

登录查看完整学习资料

相关职位

感知算法工程师(J240806005)

社招技术

公司介绍滴滴于 2016 年组建自动驾驶技术研发部门，致力于打造世界领先的 L4 级自动驾驶技术，通过科技让出行更安全、更高效。我们相信，将自动驾驶技术部署在共享出行车队中，将创造最大的社会价值。依托滴滴在出行领域的先进技术、海量数据、丰富经验和完整的出行平台生态，我们正在打造并运营世界领先的自动驾驶 Robotaxi 车队，推动自动驾驶在城市复杂交通场景中的规模化落地。职位描述作为感知团队的一员，你将与国内外顶尖人才一起，研究和开发自动驾驶领域的前沿算法，直接赋能 L4 Robotaxi 的大规模部署。你将面向真实城市道路场景中的多样化挑战，利用多模态传感器（LiDAR、Camera、Radar 等）设计、开发并优化感知算法，解决物体识别、障碍物检测、场景理解、意图预测与大模型赋能等核心问题。在这里，你将有机会：与中美两地的优秀工程师和科学家合作，参与世界级的技术竞争；深入研究并推动最前沿的学术成果在产业中的落地；在全球最大出行平台之一的业务场景中，实现科研成果的规模化应用。主要方向与职责：你将在以下方向中选定一个或多个方向深入负责，并承担从研发到落地、从算法到系统的端到端职责：（一）物体识别与跟踪设计并实现基于 LiDAR / Camera / Radar 的多模态检测模型，识别车辆、行人、自行车、静态障碍物、交通标志等提升精度、召回率与抗扰性（抗遮挡、夜间、恶劣天气、长尾类别）（二）通用障碍物识别识别未知类别 /未训练类别的障碍物基于异常检测 /开放类别识别的算法研究与工程实现在非结构化环境（施工区域、道路损坏、落物等）中提升鲁棒性（三）场景和意图理解语义分割、实例分割、道路 /车道/交通标志/交通灯等结构物识别场景理解，例如施工区域识别、可通行区域识别等意图理解，例如行人动作识别、起步意图识别等交互和事件识别，例如多方交互、交通规则冲突、非规范驾驶行为等（四）感知大模型 /多模态探索或应用预训练多模态大模型，将视觉、语言、地图/文本信息融合以增强感知能力零样本 / 少样本 / 跨域泛化的策略研发将大模型成果迁移到真实车队感知系统中，提升复杂场景下的鲁棒性（五）模型评估、验证构建完整的评估管道，包括离线评估 + 真实道路 + 模拟环境测试，支持回归检测与性能监控指标体系设计 (Precision, Recall, IoU, latency, false positives rate 等)

更新于 2026-01-06北京

算法工程实习生（大模型方向）

实习网易云音乐

【职位前言】 DeepSeek-R1的发布给世界带来了不小的震撼，更令人敬佩的是，无论是赶超OpenAI o1的模型效果，还是节省百万美元成本的工程优化，这背后的原理与实现都在官方发布的技术报告和开源项目中一一公开。大语言模型的前沿研究将不再只是少数巨头才玩得起的项目，更多的研究者可以入局这场对人工智能探索的新征程。如果您对模型背后的工程优化充满好奇（FP8混合精度训练、分布式专家并行等），想深入了解并上手实践，但又没有合适的计算资源与明确的优化目标，又对模型 post-training（GRPO强化学习、模型蒸馏等等）跃跃欲试，但又没有明确的应用场景和数据资源—— 那不妨来网易云音乐，和我们搭上这趟时代的列车，一起拆解硬核技术，聚焦于音乐业务中的搜索、推荐、广告场景，探索大模型的应用落地与高效部署。【职位描述】 1、参与大模型在后训练和推理工程中的性能优化，结合底层硬件特性从混合精度训练、矩阵计算加速、注意力机制计算优化、GPU分布式并行等方面提升工程效率； 2、通过强化学习、模型蒸馏等方式，构建音乐领域具有 CoT 推理能力的大语言模型，应用于搜索、推荐、广告等业务场景。【我们拥有】 1、音乐行业内海量用户独一无二的数据资源； 2、贴近实际的业务场景，让 idea 落地并发挥价值； 3、可观的计算资源，性能上还有极大的空间待与你一同挖掘； 4、鼓励创新探索、倡导悉心钻研、宽松融洽多元的团队氛围； 5、成果转换的支持，合作完成项目及论文，助力未来的职业发展。

更新于 2025-06-17杭州

AI产品策划实习生（游戏AI方向）

实习网易伏羲

1. 调研行业动态和业务需求，结合AI形象&场景&动画生成技术设计游戏等场景的创新型应用和玩法。 2. 根据业务数据和反馈，推动美术资产和算法效果迭代、测试和验收，保证合作项目上线和稳定运行，对玩家体验负责。 3. 了解AI形象&场景&动画的生成原理、美术资产要求，协助算法同学进行算法效果迭代。

更新于 2025-08-15杭州

平台算法实习生（网易云音乐）

实习网易云音乐

我们是网易云音乐算法团队，专注于行业领先的搜索或者推荐算法，我们致力于通过技术赋能云音乐各项业务，通过社区广场推荐，提升用户体验，产生商业化价值。在这里你可以： 1、参与云音乐各场景相关的AIGC算法应用，使用NLP、多模态、LLM等技术，优化包括多模态内容理解、大模型交互式对话、大模型AI创作生成等业务应用的效果提升； 2、参与云音乐创新业务相关的算法优化，使用业界领先的深度学习、强化学习、图模型等，优化推荐、直播、声音、社交等业务的算法； 3、参与前沿的基础算法模型建设，包括继续预训练、视频生成微调，音乐生成训练等垂类基座模型的构建和应； 4、接触到亿级别海量、真实的用户数据，使用深度学习、强化学习、图模型等算法，发挥推荐的价值； 5、使用行业领先的大规模分布式机器学习平台，例如tensorflow等开源的工具，实现并不断优化推荐、搜索等算法。

更新于 2025-06-30杭州