蔚来自动驾驶训练优化工程师
任职要求
计算机、智能辅助驾驶、人工智能等相关专业本科及以上学历,具备扎实的编程能力(Python/C++)。 具备深度学习模型设计与训练经验,熟悉智能辅助驾驶感知、预测、规划等模型的优化与训练。 熟悉主流深度学习框架(如PyTorch/TensorFlow),具备深度学习计算优化、Triton算子优化、CUDA Kernel优化经验。 熟悉分布式训练优化技术(如FSDP、DeepSpeed、ZeRO),具备数据并行、模型并行、张量并行和Pipeline并行的实践经验。 具备较强的问题分析与解决能力、良好的团队协作能力和自驱力。 加分项: 具备智能辅助驾驶端到端(E2E)训练优化经验,熟悉BEV、Transformer等自动驾驶模型架构。 拥有高性能计算(HPC)或大规模训练系统的优化经验。 具备训练监控、日志分析、自动化优化工具开发经验。 在NeurIPS、ICLR、CVPR等会议发表过相关论文者优先。
工作职责
围绕数据、模型和算力优化,提升智能辅助驾驶模型训练的效率和规模扩展能力。 设计并优化智能辅助驾驶场景下的视频数据加载、预处理和流式训练方案,提升数据处理效率和系统吞吐量。 协同优化智能辅助驾驶核心模型(如感知、预测、规划)的设计与训练策略,提高模型精度与收敛速度。 应用torch.compile、Triton等技术,优化计算图和分布式训练(数据、模型、张量及Pipeline并行)方案,实现高效算力扩展。 构建自动化优化流程和监控体系,实时分析训练性能,推动系统持续迭代升级,同时支持其他优化探索。
1. 负责深度学习训练框架的架构设计、关键技术研究及研发落地 2. 负责自动驾驶模型训练优化,优化低效算子、数据预处理、通信、低精度训练等。 3. 负责推进训练框架和AI平台的结合,建立先进的训练调度机制、集群算力利用率评估机制等。
自动驾驶模型训练优化高级/资深工程师/专家 : 1、模型训练效率优化:深入研究并优化模型训练过程中的效率问题,包括但不限于减少训练时延,通过调整训练策略、优化数据加载与预处理流程、改进算法实现等方式,确保模型能够快速、高效地完成训练任务,以满足公司自动驾驶技术研发对模型迭代速度的要求。 2、硬件资源利用率提升:专注于提高SM利用率、GPU利用率等硬件资源的使用效率。分析现有模型训练在硬件资源上的瓶颈,运用专业知识和技术手段,如合理配置训练任务的并行度、优化模型结构以更好地适配硬件特性、探索新的硬件加速技术等,充分挖掘硬件的计算潜力,降低硬件资源的浪费,提升整体训练性能。 3、训练策略与算法改进:持续关注和研究前沿的训练策略与算法,结合公司自动驾驶模型的特点和需求,对其进行评估、引入和改进。例如探索更高效的优化器、采用混合精度训练等方法,以进一步提升模型训练的效果和效率,为自动驾驶系统的性能优化提供有力支持。 4、性能监控与分析:建立和完善模型训练性能的监控体系,实时监测训练过程中的各项关键指标,如训练速度、资源占用情况等。通过对海量性能数据的深入分析,快速定位问题所在,并制定针对性的优化方案,确保模型训练过程始终处于高效、稳定的状态,及时解决可能出现的性能瓶颈问题。

职位描述 - 研发基于深度学习的自动驾驶感知和预测的前沿技术; - 根据应用场景和客户需求定义,提供模型压缩训练优化及推理优化相关方案(包含算法及工程); - 跟踪、分析、评估各主流深度学习框架; 职位要求 - 计算机/数学/物理/电子工程/自动控制专业硕士及以上学历,AI相关研究方向; - 精通C++,熟悉典型的计算机体系结构,有分布式性能优化经验,有出色的编程能力。 - 熟悉至少一种深度学习框架;具有2年以上深度学习框架开发经验。了解分布式训练,模型并行相关技术。 - 熟悉CUDA/TensorRT或其它AI加速库开发经验; - 熟练掌握Linux 应用环境、 有shell脚本编程经验;熟悉Python语言。