
Momenta资深模型训练优化工程师
任职要求
-
工作职责
职位描述 - 研发基于深度学习的自动驾驶感知和预测的前沿技术; - 根据应用场景和客户需求定义,提供模型压缩训练优化及推理优化相关方案(包含算法及工程); - 跟踪、分析、评估各主流深度学习框架; 职位要求 - 计算机/数学/物理/电子工程/自动控制专业硕士及以上学历,AI相关研究方向; - 精通C++,熟悉典型的计算机体系结构,有分布式性能优化经验,有出色的编程能力。 - 熟悉至少一种深度学习框架;具有2年以上深度学习框架开发经验。了解分布式训练,模型并行相关技术。 - 熟悉CUDA/TensorRT或其它AI加速库开发经验; - 熟练掌握Linux 应用环境、 有shell脚本编程经验;熟悉Python语言。

岗位职责 1. 负责智能驾驶模型在多种不同硬件平台的极致性能优化,结合编译优化、并行计算优化、图融合、高效 CUDA 算子开发实现行业领先的车端推理性能。 2. 针对特定NPU硬件计算平台,基于对硬件体系结构的深入理解,实现对硬件的高效利用。 3. 针对Pytorch/CUDA相关GPU计算任务,进行算子和系统优化,提升训练/推理效率。
自动驾驶模型训练优化高级/资深工程师/专家 : 1、模型训练效率优化:深入研究并优化模型训练过程中的效率问题,包括但不限于减少训练时延,通过调整训练策略、优化数据加载与预处理流程、改进算法实现等方式,确保模型能够快速、高效地完成训练任务,以满足公司自动驾驶技术研发对模型迭代速度的要求。 2、硬件资源利用率提升:专注于提高SM利用率、GPU利用率等硬件资源的使用效率。分析现有模型训练在硬件资源上的瓶颈,运用专业知识和技术手段,如合理配置训练任务的并行度、优化模型结构以更好地适配硬件特性、探索新的硬件加速技术等,充分挖掘硬件的计算潜力,降低硬件资源的浪费,提升整体训练性能。 3、训练策略与算法改进:持续关注和研究前沿的训练策略与算法,结合公司自动驾驶模型的特点和需求,对其进行评估、引入和改进。例如探索更高效的优化器、采用混合精度训练等方法,以进一步提升模型训练的效果和效率,为自动驾驶系统的性能优化提供有力支持。 4、性能监控与分析:建立和完善模型训练性能的监控体系,实时监测训练过程中的各项关键指标,如训练速度、资源占用情况等。通过对海量性能数据的深入分析,快速定位问题所在,并制定针对性的优化方案,确保模型训练过程始终处于高效、稳定的状态,及时解决可能出现的性能瓶颈问题。
1、参与设计和开发AIOps解决方案,帮助实现希音运维的智能化。 2、参与公司容量资源规划:运用机器学习和数据分析技术,预测容量变化、监控和分析系统性能、识别潜在问题,并提供可解释的解决方案,以提高资源利用率,提前发现容量瓶颈。 3、打通故障从告警发现、故障定位、故障恢复的全链路,借助于机器学习、深度学习、大模型等相关技术,帮助进行故障的异常检测、告警降噪、根因定位、预案的决策等,进而提升故障恢复效率。