logo of kuaishou

快手AI性能优化专家

社招全职3-5年D7211地点:北京状态:招聘

任职要求


1、计算机等相关专业本科及以上学历;
2、具备良好的团队协作能力,喜欢钻研技术,善于分析、解决性能问题;
3、掌握C++/Python编程语言,熟悉常用数据结构;
4、熟悉PytorchTensorFlowONNX等框架,了解TVM、XLA、MLIR等AI编译技术;
5、熟悉深度学习基本知识,了解常用的推荐模型架构,有模型的开发、部署、优化经验;
6、熟练使用nsys、ncu、perf等性能分析工具。

工作职责


1、诊断模型训练、推理的性能问题,提升GPU资源使用率;
2、对模型做算子优化,提升模型的训练、推理性能。
包括英文材料
学历+
C+++
Python+
数据结构+
PyTorch+
TensorFlow+
ONNX+
深度学习+
Perf+
相关职位

logo of bytedance
社招A127562

负责火山引擎-IaaS异构云产品的性能优化,聚焦AI场景、大模型训练和推理的性能提升,构建通用的软件加速方案,协助客户挖掘硬件性能潜力,提升应用表现。 主要工作包括: 1、负责AI Infra的性能分析,构建性能标尺和竞争力模型; 2、负责基于云上AIGC等业务场景的性能分析以及训练、推理场景的底层优化工作; 3、负责云上IaaS 国产加速器在AI场景的引入、落地和优化工作。

更新于 2024-01-05
logo of bytedance
社招A254950

负责火山引擎-IaaS异构云产品的性能优化,聚焦AI场景、大模型训练和推理的性能提升,构建通用的软件加速方案,协助客户挖掘硬件性能潜力,提升应用表现。 主要工作包括: 1、负责AI Infra的性能分析,构建性能标尺和竞争力模型; 2、负责基于云上AIGC等业务场景的性能分析以及训练、推理场景的底层优化工作; 3、负责云上IaaS 国产加速器在AI场景的引入、落地和优化工作。

更新于 2024-01-05
logo of honor
社招5年以上研发类

1、算法优化:负责AI算法在CPU/GPU/NPU等处理器上的性能,内存,和功耗的优化方案设计和验证;负责持续跟踪业界的模型压缩方案,超越并创新。 2、系统平台:负责AI相关芯片平台的软硬件能力识别,包括常见芯片厂商不同平台的迭代跟踪。能够针对平台特点,对CNN/Transformer等模型的部署进行评估。

更新于 2025-08-13
logo of aliyun
社招5年以上云智能集团

1. 负责研发AI类算法的计算性能优化能力,解决大模型等情境的算力和访存瓶颈,提升AI模型在GPU、AI加速器等硬件上部署性能和效率,推动大模型普惠应用和高性价比的竞争力; 2. 负责研发业界SOTA的计算性能优化算法创新和工程落地,增强技术壁垒,并在云的商业业务中产生核心价值; 3. 负责高性能AI基础设施的构建,基于软硬结合的计算性能优化能力,在AI类业务场景尤其是大模型场景下,通过结合模型算法和硬件来充分挖掘软硬协同的组合优化潜力,实现单一领域无法达到的优化边界和收益,带来高价值的性能和成本优势。

更新于 2025-08-22