logo of sensetime

商汤高性能计算研发工程师

社招全职1-5年系统开发地点:上海状态:招聘

任职要求


1. 精通 C++,具备扎实数据结构算法基础,有 1 - 5 年高性能优化工作经验;
2. 熟悉主流并行编程、性能优化技术与 CUDA 编程,掌握 cudnn/cutlass/cublass 之一,有相关优化经验优先;
3. 有 TVM/MLIR/XLA 等自动化编译技术从业经验者优先; 
4. …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 开发多模态场景下的高性能推理计算平台,优化车载大模型业务训练与推理性能,助力业务落地;
2. 构建自研高性能引擎,跟踪前沿技术,打造领先的推理平台;
3. 基于 GPU/CPU 搭建推理系统,提升 AI 系统技术水平,加速多模态视觉及语言模型;
4. 负责音频、视频、文本多模态工程全周期开发,涵盖数据准备 / 处理加速、模型部署评估;
包括英文材料
C+++
数据结构+
算法+
CUDA+
还有更多 •••
相关职位

logo of baidu
社招TPG

-参与深度学习平台飞桨( PaddlePaddle)推理框架的设计、开发和业务支持 -负责深度学习框架的性能优化工作,包括但不限于功能模块在CPU/GPU上的深度优化工作 -负责深度学习推理框架前瞻技术的跟踪调研,实现技术创新突破 -参与深度学习框架的易用性优化工作,使开发者能够以更简单的方式实现各类任务,降低学习成本和开发成本 -负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化 -负责文心一言、萝卜快跑、搜索等业务大模型的推理性能优化

更新于 2025-06-10北京|上海
logo of baidu
社招ACG

-负责昆仑芯AI芯片性能深度学习高性能计算库开发,支持各种AI场景 -探索新一代AI芯片编程模型和架构 -深度学习框架Pytorch/PaddlePaddle图性能优化 -大规模分布式训练性能优化,AI芯片通信库开发,探索高效的芯片互联架构

更新于 2025-04-18北京|上海
logo of baidu
社招3-5年ACG

-参与百度智能云高性能计算系统的研发,包括集群管理、资源管理、任务调度、软件市场等方面 -参与高性能计算系统的易用性优化工作,使用户能够以更简单的方式实现管理并运行计算任务,降低学习成本和使用成本 -负责高性能计算系统的性能优化工作,包括但不限于功能模块在CPU/GPU上的深度优化工作 -探索业界新技术方向,将容器技术与高性能计算系统结合

更新于 2024-01-31北京
logo of tencent
社招3年以上TEG技术

1.基于开源项目 Ray,打造业内领先的通用分布式计算引擎,包括但不限于以下方向:引擎内核(分布式Task调度与执行)、分布式数据处理框架、分布式在线服务编排框架等; 2.面向 Data + AI,支持和拓展以 Ray 为 infra 的多种业务场景,包括但不限于以下方向:数据科学、大模型训练数据管道服务、在线推理与离线推理、AI Agent与应用系统、隐私计算、图计算等; 3.与 K8S 深度融合,建设云原生环境下超大规模分布式系统的服务能力与平台化能力,为业务提供高可用、可扩展、高易用性的集群化服务; 4.参与开源共建与合作,提升团队与个人在业界的影响力。

更新于 2025-06-09北京