logo of momenta

Momenta自动驾驶模型推理优化专家

社招全职3年以上算法地点:北京 | 苏州 | 上海 | 深圳状态:招聘

任职要求


1. 工作3年以上,计算机/数学/物理/电子工程/自动控制专业硕士及以上学历。
2. 优秀的代码能力,熟练掌握C/C++Python,有 CUDA 开发经验,熟悉TVM/TensorRT/Triton/Cutlass等…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责智能驾驶模型在多种不同硬件平台的极致性能优化,结合编译优化、并行计算优化、图融合、高效 CUDA 算子开发实现行业领先的车端推理性能。
2. 针对特定NPU硬件计算平台,基于对硬件体系结构的深入理解,实现对硬件的高效利用。
3. 针对Pytorch/CUDA相关GPU计算任务,进行算子和系统优化,提升训练/推理效率。
包括英文材料
学历+
C+
C+++
Python+
还有更多 •••
相关职位

logo of liauto
社招自动驾驶

1. 负责自动驾驶无图、端到端、VLA等联合模型(OneModel)的研发,包括模型训练和发版、模型结构优化、推理优化、数据管理等; 2. 负责支持自动驾驶模型训练框架的研发和升级。

北京
logo of aliyun
社招5年以上云智能集团

你将加入PAI平台团队,负责面向各类AI应用场景的模型训练与推理性能优化工作。该岗位聚焦于AI计算性能与系统效率的极致提升,以多层次优化手段,持续提升模型训练与推理的速度、稳定性与资源利用率,具体工作内容包含但不限于: ● 分析客户模型在不同硬件(GPU、NPU、CPU 等)和集群环境中的性能瓶颈,制定优化方案; ● 对主流深度学习框架(如 PyTorch、TensorFlow、JAX 等)进行算子、内核或图优化; ● 深入理解分布式训练架构(如数据并行、模型并行、流水并行等),优化通信与调度性能; ● 在推理端负责模型性能瓶颈分析,并进行量化、剪枝、融合、TensorRT/ONNX Runtime 等优化; ● 与平台团队协作,优化训练任务调度、算力利用、容器化运行效率以及多租户资源隔离; ● 支持重点客户模型性能调优,提供端到端性能优化方案与技术支持。

更新于 2025-11-17北京|杭州|上海
logo of liauto
社招3年以上自动驾驶

1.负责理想汽车自动驾驶端到端模型方法研发和工程落地,包活动静态感知/通用障碍物/障碍物预测决策等端到端模型; 2.开发高效离线训练框架,以及可实时运行的在线推理框架,优化模型推理性能,研发模型部署工具链和优化工具; 3.建立云端数据感知/决策联合标注Pipeline、数据挖掘机制以及难样本分析等工具链,利用影子模型挖掘众包数据,通过数据闭环持续选代模型能力。

北京
logo of sensetime
社招算法工程

1.负责智能驾驶模型训练优化的研究和落地,通过数据并行,模型并行,通信优化,CUDA算子优化等,大幅提升模型的训练速度与效率。 2.深入分析训练系统,定位和解决训练系统各个层次的性能瓶颈,不断提升训练效率,推进算法的高效选代

更新于 2025-10-11上海