Momenta云端模型性能优化工程师

社招全职算法2025-12-29地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1. 熟练使用 C++/Python，操作系统原理，计算机基础知识掌握扎实
2. 熟悉计算机体系结构，对 GPU、CPU、NPU 等计算加速单元有一定的理解，有 CUDA、Neon、trition 等…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 负责将深度学习模型（如 CNN、Transformer 等）高效部署到车端或云端集群，优化推理时延、内存占用及功耗
2. 实现车端模型包括大模型的量化（INT8/fp8），结合 TensorRT、torch 等框架完成端到端性能调优
3. 开发或优化高性能算子，利用 CUDA、OpenCL、NEON 指令集或硬件加速库（cuDNN、OneDNN）实现极致性能

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

C+++

Python+

CUDA+

TensorRT+

vLLM+

还有更多 •••

登录查看完整学习资料

相关职位

算法工程师（VLM/LLM方向）(J250603009)

社招技术

* 基于 Vision-Language Models (VLM) 和 Large Language Models (LLM)，设计与实现自动驾驶中行为预测与运动规划的基座模型（Foundation Model） * 利用多模态预训练大模型进行轨迹生成与融合，提升基座模型对其他交通参与者意图的理解与预测能力 * 针对车端／云端部署，开展模型算法层面性能优化工作，例如压缩、剪枝、蒸馏、训练和推理加速等，确保模型可用性、系统实时性与资源利用率 * 与算法、软件和系统团队紧密协作，推动模型集成及在仿真与真实车载平台的落地

更新于 2025-09-04杭州

AI-Foundation Model CN 算法实习生

实习技术类

无

更新于 2025-07-04北京

训练平台性能优化工程师实习生

实习

深度优化训练流程主导模型训练全链路性能分析与优化，设计GPU资源弹性调度策略开发自动化训练加速工具链，构建可扩展的云端训练框架研发混合精度训练、梯度压缩等前沿技术，突破训练吞吐瓶颈构建训练优化体系制定标准化训练效能评估体系，建立成本-效率量化模型设计可复用的训练加速组件库，沉淀最佳实践方法论开发训练过程性能分析平台，实现性能问题智能诊断赋能业务研发优化多任务资源调度策略，提升GPU集群整体利用率为算法团队提供训练加速解决方案，缩短模型迭代周期

更新于 2025-07-22北京

IAG-智能驾驶-云端模型部署优化工程师

社招

1.负责将智驾算法团队研发的云端大模型（如感知模型、自动标注模型）进行高效的部署、优化与服务化。 2.设计并实现高性能的模型推理服务，保障其高可用与低延迟； 3.运用模型压缩、编译优化及算子融合等技术，显著提升模型在GPU集群上的推理效率与资源利用率； 4.构建并维护一体化的模型部署与监控平台。

更新于 2025-12-02