
商汤高性能计算研发工程师
任职要求
1. 精通 C++,具备扎实数据结构和算法基础,有 1 - 5 年高性能优化工作经验; 2. 熟悉主流并行编程、性能优化技术与 CUDA 编程,掌握 cudnn/cutlass/cublass 之一,有相关优化经验优先; 3. 有 TVM/MLIR/XLA 等自动化编译技术从业经验者优先; 4. …
工作职责
1. 开发多模态场景下的高性能推理计算平台,优化车载大模型业务训练与推理性能,助力业务落地; 2. 构建自研高性能引擎,跟踪前沿技术,打造领先的推理平台; 3. 基于 GPU/CPU 搭建推理系统,提升 AI 系统技术水平,加速多模态视觉及语言模型; 4. 负责音频、视频、文本多模态工程全周期开发,涵盖数据准备 / 处理加速、模型部署评估;
-参与深度学习平台飞桨( PaddlePaddle)推理框架的设计、开发和业务支持 -负责深度学习框架的性能优化工作,包括但不限于功能模块在CPU/GPU上的深度优化工作 -负责深度学习推理框架前瞻技术的跟踪调研,实现技术创新突破 -参与深度学习框架的易用性优化工作,使开发者能够以更简单的方式实现各类任务,降低学习成本和开发成本 -负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化 -负责文心一言、萝卜快跑、搜索等业务大模型的推理性能优化
-负责昆仑芯AI芯片性能深度学习高性能计算库开发,支持各种AI场景 -探索新一代AI芯片编程模型和架构 -深度学习框架Pytorch/PaddlePaddle图性能优化 -大规模分布式训练性能优化,AI芯片通信库开发,探索高效的芯片互联架构
-参与百度智能云高性能计算系统的研发,包括集群管理、资源管理、任务调度、软件市场等方面 -参与高性能计算系统的易用性优化工作,使用户能够以更简单的方式实现管理并运行计算任务,降低学习成本和使用成本 -负责高性能计算系统的性能优化工作,包括但不限于功能模块在CPU/GPU上的深度优化工作 -探索业界新技术方向,将容器技术与高性能计算系统结合
1.基于开源项目 Ray,打造业内领先的通用分布式计算引擎,包括但不限于以下方向:引擎内核(分布式Task调度与执行)、分布式数据处理框架、分布式在线服务编排框架等; 2.面向 Data + AI,支持和拓展以 Ray 为 infra 的多种业务场景,包括但不限于以下方向:数据科学、大模型训练数据管道服务、在线推理与离线推理、AI Agent与应用系统、隐私计算、图计算等; 3.与 K8S 深度融合,建设云原生环境下超大规模分布式系统的服务能力与平台化能力,为业务提供高可用、可扩展、高易用性的集群化服务; 4.参与开源共建与合作,提升团队与个人在业界的影响力。