logo of momenta

Momenta资深模型训练优化工程师

社招全职算法地点:北京 | 苏州 | 上海 | 深圳状态:招聘

任职要求


-

工作职责


职位描述
- 研发基于深度学习的自动驾驶感知和预测的前沿技术;
- 根据应用场景和客户需求定义,提供模型压缩训练优化及推理优化相关方案(包含算法及工程);
- 跟踪、分析、评估各主流深度学习框架;
职位要求
- 计算机/数学/物理/电子工程/自动控制专业硕士及以上学历,AI相关研究方向;
- 精通C++,熟悉典型的计算机体系结构,有分布式性能优化经验,有出色的编程能力。
- 熟悉至少一种深度学习框架;具有2年以上深度学习框架开发经验。了解分布式训练,模型并行相关技术。
- 熟悉CUDA/TensorRT或其它AI加速库开发经验;
- 熟练掌握Linux 应用环境、 有shell脚本编程经验;熟悉Python语言。
包括英文材料
相关职位

logo of momenta
社招3年以上

岗位职责 1. 负责智能驾驶模型在多种不同硬件平台的极致性能优化,结合编译优化、并行计算优化、图融合、高效 CUDA 算子开发实现行业领先的车端推理性能。 2. 针对特定NPU硬件计算平台,基于对硬件体系结构的深入理解,实现对硬件的高效利用。 3. 针对Pytorch/CUDA相关GPU计算任务,进行算子和系统优化,提升训练/推理效率。

更新于 2025-02-24
logo of xpeng
社招4年以上

自动驾驶模型训练优化高级/资深工程师/专家 : 1、模型训练效率优化:深入研究并优化模型训练过程中的效率问题,包括但不限于减少训练时延,通过调整训练策略、优化数据加载与预处理流程、改进算法实现等方式,确保模型能够快速、高效地完成训练任务,以满足公司自动驾驶技术研发对模型迭代速度的要求。 2、硬件资源利用率提升:专注于提高SM利用率、GPU利用率等硬件资源的使用效率。分析现有模型训练在硬件资源上的瓶颈,运用专业知识和技术手段,如合理配置训练任务的并行度、优化模型结构以更好地适配硬件特性、探索新的硬件加速技术等,充分挖掘硬件的计算潜力,降低硬件资源的浪费,提升整体训练性能。 3、训练策略与算法改进:持续关注和研究前沿的训练策略与算法,结合公司自动驾驶模型的特点和需求,对其进行评估、引入和改进。例如探索更高效的优化器、采用混合精度训练等方法,以进一步提升模型训练的效果和效率,为自动驾驶系统的性能优化提供有力支持。 4、性能监控与分析:建立和完善模型训练性能的监控体系,实时监测训练过程中的各项关键指标,如训练速度、资源占用情况等。通过对海量性能数据的深入分析,快速定位问题所在,并制定针对性的优化方案,确保模型训练过程始终处于高效、稳定的状态,及时解决可能出现的性能瓶颈问题。

更新于 2023-12-25
logo of shein
社招3年以上信息技术类

1、参与设计和开发AIOps解决方案,帮助实现希音运维的智能化。 2、参与公司容量资源规划:运用机器学习和数据分析技术,预测容量变化、监控和分析系统性能、识别潜在问题,并提供可解释的解决方案,以提高资源利用率,提前发现容量瓶颈。 3、打通故障从告警发现、故障定位、故障恢复的全链路,借助于机器学习、深度学习、大模型等相关技术,帮助进行故障的异常检测、告警降噪、根因定位、预案的决策等,进而提升故障恢复效率。

更新于 2024-07-12
logo of baidu
社招MEG

-主导面向内容生态AIGC的多模态大模型的创新开发,涵盖模型架构设计、训练算法优化等关键环节,引领技术发展方向 -主导多模态训练数据的处理流程,包括数据采集、清洗、标注及管理等,为模型训练提供高质量语料​ -基于多模态大模型,适配业务场景各类下游应用,实现推动技术落地应用 -密切追踪国际多模态大模型领域的最新研究成果与发展趋势,积极引入先进理念和技术,保持技术的领先性 -积极撰写高水平学术论文,踊跃投稿至顶会和期刊,提升技术影响力

更新于 2025-06-04