logo of momenta

Momenta资深模型推理优化工程师

社招全职3年以上地点:北京 | 深圳 | 上海状态:招聘

任职要求


岗位要求
1. 工作3年以上,计算机/数学/物理/电子工程/自动控制专业硕士及以上学历。
2. 优秀的代码能力,熟练掌握C/C++Python,有 CUDA 开发经验,熟悉TVM/TensorRT/Triton/Cutlass等推理框架优先。
3. 熟悉计算机体系结构,对GPU、NPU等有比较深刻的理解。
4. 熟悉CNN/Transformers/DETR等主流模型原理。
5. 良好的团队协作能力;创新性强,有良好的动手实现能力,对技术有热情。

工作职责


岗位职责
1. 负责智能驾驶模型在多种不同硬件平台的极致性能优化,结合编译优化、并行计算优化、图融合、高效 CUDA 算子开发实现行业领先的车端推理性能。
2. 针对特定NPU硬件计算平台,基于对硬件体系结构的深入理解,实现对硬件的高效利用。
3. 针对Pytorch/CUDA相关GPU计算任务,进行算子和系统优化,提升训练/推理效率。
包括英文材料
学历+
C+
C+++
Python+
CUDA+
TensorRT+
Triton Inference Server+
CNN+
相关职位

logo of momenta
社招算法

职位描述 - 研发基于深度学习的自动驾驶感知和预测的前沿技术; - 根据应用场景和客户需求定义,提供模型压缩训练优化及推理优化相关方案(包含算法及工程); - 跟踪、分析、评估各主流深度学习框架; 职位要求 - 计算机/数学/物理/电子工程/自动控制专业硕士及以上学历,AI相关研究方向; - 精通C++,熟悉典型的计算机体系结构,有分布式性能优化经验,有出色的编程能力。 - 熟悉至少一种深度学习框架;具有2年以上深度学习框架开发经验。了解分布式训练,模型并行相关技术。 - 熟悉CUDA/TensorRT或其它AI加速库开发经验; - 熟练掌握Linux 应用环境、 有shell脚本编程经验;熟悉Python语言。

更新于 2024-04-18
logo of kuaishou
社招5年以上D8039

1.负责AI平台架构设计和AI工程化技术实现; 2.通过AI基础设施和软硬件协同优化来提升公司AI模型训练和推理的效率; 3. 负责云侧或端侧大模型和小模型推理服务开发、性能优化、上线部署等工作。

更新于 2025-04-01
logo of baidu
社招MEG

-参与公司深度学习推理引擎、AI编译器的架构设计、开发和优化,确保领域内推理引擎技术的先进性 -参与多模态LLM、视频生成模型推理性能性能的极致优化,保持业界SOTA -研究最近的推理优化技术,跟踪最新研究进展和技术趋势,提出改进和创新的想法,推动团队的技术发展,并应用到业务 -和团队一起攻克高性能、高并发、高可用性等各种不同技术场景下的技术挑战

更新于 2025-04-25
logo of bytedance
社招A217506A

1、大模型关键技术突破,构建AI应用开发平台核心竞争力,支撑共享引擎大模型业务快速推进和迭代; 2、跟踪安全大模型领域的前沿技术与行业动态,及时将新技术、新方法引入到公司的安全研发工作中,持续创新安全应用解决方案,保持公司在安全技术领域的竞争力; 3、深度参与深度学习大模型产品研发,工程优化和应用过程中的技术落地,重点关注大模型部署、对齐、模型评估 推理优化加速等。

更新于 2024-12-17