logo of horizon

地平线模型训练平台实习生

校招全职软件序列地点:北京状态:招聘

任职要求


基本要求
- 计算机科学、人工智能或相关方向 在读博士
- 扎实的编程基础,熟练掌握 PythonC++
- 熟悉至少一种深度学习框架,例如 PyTorch
- 熟悉 Linux开发环境,具备良好的系统调试能力
- 对 大规模机器学习系统、分布式训练或AI基础设施 有浓厚兴趣
 

加分项
具备以下经验之一者优先:
- 分布式训练经验(DDP / FSDP / DeepSpeed / Megatron 等)
- CUDA或GPU性能优化经验
- 大规模训练系统或训练平台研发经验
- 自动驾驶相关模型…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


关于团队
我们正在构建支撑下一代自动驾驶模型的大规模训练基础设施。平台每天处理 PB级自动驾驶数据,在 万卡规模GPU集群 上运行大规模分布式训练任务,为感知、预测和端到端驾驶模型提供高效稳定的训练能力。
团队聚焦 大规模机器学习系统(ML Systems)与训练基础设施(Training Infrastructure),解决自动驾驶模型训练中的核心系统问题,包括分布式训练效率、数据管线扩展性、以及超大规模GPU集群的稳定性与资源利用率优化。


工作内容
你将参与解决自动驾驶大规模模型训练中的核心系统问题,包括:
- 设计与优化自动驾驶模型的 大规模训练基础设施
- 提升 万卡GPU训练集群 的训练效率与系统稳定性
- 构建可扩展的 PB级自动驾驶数据训练 pipeline
- 分析并解决分布式训练中的性能瓶颈,包括 GPU利用率、通信开销、I/O吞吐等问题
- 与自动驾驶算法团队协作,加速感知、多模态及端到端模型的训练迭代
包括英文材料
Python+
C+++
深度学习+
PyTorch+
Linux+
机器学习+
FSDP+
还有更多 •••
相关职位

logo of horizon
实习软件序列

关于团队 我们正在构建支撑下一代自动驾驶模型的大规模训练基础设施。平台每天处理 PB级自动驾驶数据,在 万卡规模GPU集群 上运行大规模分布式训练任务,为感知、预测和端到端驾驶模型提供高效稳定的训练能力。 团队聚焦 大规模机器学习系统(ML Systems)与训练基础设施(Training Infrastructure),解决自动驾驶模型训练中的核心系统问题,包括分布式训练效率、数据管线扩展性、以及超大规模GPU集群的稳定性与资源利用率优化。 工作内容 你将参与解决自动驾驶大规模模型训练中的核心系统问题,包括: - 设计与优化自动驾驶模型的 大规模训练基础设施 - 提升 万卡GPU训练集群 的训练效率与系统稳定性 - 构建可扩展的 PB级自动驾驶数据训练 pipeline - 分析并解决分布式训练中的性能瓶颈,包括 GPU利用率、通信开销、I/O吞吐等问题 - 与自动驾驶算法团队协作,加速感知、多模态及端到端模型的训练迭代

更新于 2026-03-16北京
logo of didi
社招技术

公司介绍 滴滴于 2016 年组建自动驾驶技术研发部门,致力于打造世界领先的 L4 级自动驾驶技术,通过科技让出行更安全、更高效。我们相信,将自动驾驶技术部署在共享出行车队中,将创造最大的社会价值。依托滴滴在出行领域的 先进技术、海量数据、丰富经验和完整的出行平台生态,我们正在打造并运营世界领先的自动驾驶 Robotaxi 车队,推动自动驾驶在城市复杂交通场景中的规模化落地。 职位描述 作为感知团队的一员,你将与国内外顶尖人才一起,研究和开发自动驾驶领域的前沿算法,直接赋能 L4 Robotaxi 的大规模部署。 你将面向真实城市道路场景中的多样化挑战,利用多模态传感器(LiDAR、Camera、Radar 等)设计、开发并优化感知算法,解决物体识别、障碍物检测、场景理解、意图预测与大模型赋能等核心问题。 在这里,你将有机会: 与中美两地的优秀工程师和科学家合作,参与世界级的技术竞争; 深入研究并推动最前沿的学术成果在产业中的落地; 在全球最大出行平台之一的业务场景中,实现科研成果的规模化应用。 主要方向与职责: 你将在以下方向中选定一个或多个方向深入负责,并承担从研发到落地、从算法到系统的端到端职责: (一)物体识别与跟踪 设计并实现基于 LiDAR / Camera / Radar 的多模态检测模型,识别车辆、行人、自行车、静态障碍物、交通标志等 提升精度、召回率与抗扰性(抗遮挡、夜间、恶劣天气、长尾类别) (二)通用障碍物识别 识别未知类别 /未训练类别的障碍物 基于异常检测 /开放类别识别的算法研究与工程实现 在非结构化环境(施工区域、道路损坏、落物等)中提升鲁棒性 (三)场景和意图理解 语义分割、实例分割、道路 /车道/交通标志/交通灯等结构物识别 场景理解,例如施工区域识别、可通行区域识别等 意图理解,例如行人动作识别、起步意图识别等 交互和事件识别,例如多方交互、交通规则冲突、非规范驾驶行为等 (四)感知大模型 /多模态 探索或应用预训练多模态大模型,将视觉、语言、地图/文本信息融合以增强感知能力 零样本 / 少样本 / 跨域泛化的策略研发 将大模型成果迁移到真实车队感知系统中,提升复杂场景下的鲁棒性 (五)模型评估、验证 构建完整的评估管道,包括离线评估 + 真实道路 + 模拟环境测试,支持回归检测与性能监控 指标体系设计 (Precision, Recall, IoU, latency, false positives rate 等)

更新于 2026-01-06北京
logo of netease
实习网易云音乐

我们是网易云音乐算法团队,专注于行业领先的搜索或者推荐算法,我们致力于通过技术赋能云音乐各项业务,通过社区广场推荐,提升用户体验,产生商业化价值。 在这里你可以: 1、参与云音乐各场景相关的AIGC算法应用,使用NLP、多模态、LLM等技术,优化包括多模态内容理解、大模型交互式对话、大模型AI创作生成等业务应用的效果提升; 2、参与云音乐创新业务相关的算法优化,使用业界领先的深度学习、强化学习、图模型等,优化推荐、直播、声音、社交等业务的算法; 3、参与前沿的基础算法模型建设,包括继续预训练、视频生成微调,音乐生成训练等垂类基座模型的构建和应; 4、接触到亿级别海量、真实的用户数据,使用深度学习、强化学习、图模型等算法,发挥推荐的价值; 5、使用行业领先的大规模分布式机器学习平台,例如tensorflow等开源的工具,实现并不断优化推荐、搜索等算法。

更新于 2025-06-30杭州
logo of antgroup
社招技术类-算法

1、研发面向云计算底座海量数据的大模型,包括但不限于代码大模型、全模态、大规模图学习等领域相关的大模型的应用算法研发; 2、参与大模型应用研发全流程的工作,包括但不限于模型算法设计、代码开发、训练、部署优化、调试、评测;技术创新如专利、论文的撰写;外部技术影响力交流等; 3、推动大模型在DevOps提效、内外部智能体业务应用、爆款AI原生应用、安全和技术风险防控等场景的业务落地;

更新于 2025-07-14北京|杭州