logo of kuaishou

快手多元算力AI优化工程师(上海)

社招全职D8950地点:上海状态:招聘

任职要求


1、对AI领域的基本理论与常见模型算法,有深刻的理解;
2、熟练使用tensor flow或pytorch,进行模型训练或推理优化;
3、对使用GPU做AI算法加速有相关经历,熟悉GPU CUDA编程;
4、对计算机体系结构有深刻理解,至少对以下子领域中的两个或两个以上有相关经历:CPU、GPU微架构性能分析,Linux内核,网络协议,集合通讯原理。

工作职责


从事AIGC相关领域的硬件解决方案开发与性能优化工作,具体包括以下二者或二者之一:
1、大规模训练集群在LLM模型训练负载下的性能分析与相关优化工作;
2、业界AIGC主流模型在推理侧的性能分析与优化工作。
包括英文材料
算法+
PyTorch+
CUDA+
Linux+
内核+
相关职位

logo of baidu
社招1年以上ACG

-负责云原生产品 Kubernetes 容器引擎、镜像服务、可观测服务等的设计与研发工作,提升产品竞争力及体验 -负责大规模 AI Infra 云原生底座的设计与研发工作,基于云原生技术打造异构多元芯算力底座,支持国产化信创,支持业务进行大规模训练、容错及弹性推理,构建异构多元芯算力底座 -负责打造现代化的云原生智能运维能力,设计和实现覆盖 AI 场景全栈的故障感知、诊断及自愈能力 -持续提升云原生产品服务及基础设施的稳定性,优化服务性能,提升架构的可扩展性 -探索业界最新技术方向,参与开源社区,提升百度云原生核心竞争力

更新于 2025-04-28
logo of baidu
社招ACG

-AI大模型方案设计与优化。负责为客户构思、设计并实施AI大模型的先进解决方案,旨在从AI算力基础设施、AI开发工具、AI大模型的数据与算法,以及AI大模型的应用场景等多个层面,推动客户在百度云平台上实现AI应用快速实验与落地 -深度客户管理。主动与客户进行深度沟通,洞察其业务需求与挑战,最终实现客户成功的结果。通过持续的实践经验积累,形成具有行业特色的AI解决方案,并致力于在行业中实现突破性的应用 -项目执行与推动。担任关键角色,推动客户上云、用云的项目顺利进行,确保项目从商务合作、技术方案、业务进度、风险把控、资源分配等各方面的协同工作得以落地执行 -产品创新与升级。不断将客户的需求转化为实际的云标准产品功能,积极推动百度云平台上产品的持续进步与迭代,确保我们的产品与服务始终保持在行业的前沿

更新于 2024-01-31
logo of kuaishou
社招D8950

从事AIGC相关领域的平台级软硬件解决方案开发与性能优化工作,具体包括以下二者或二者之一: 1、大规模训练集群在LLM模型训练负载下的性能分析与相关优化工作; 2、AIGC主流模型(SD/类Sora)在训练/推理侧的性能分析与优化工作。

更新于 2025-06-05
logo of kuaishou
社招D13084

1、跟踪业界最新强化学习领域算法/训练范式进展,完成大模型强化学习训练框架的设计与实现,提升大集群分布式训练性能,缩短模型迭代周期; 2、负责大模型SFT/蒸馏训练框架的设计与实现,提升分布式训练性能; 3、负责分布式大模型推理引擎的方案设计与实现,快速完成业界Sota模型的规模化上线服务; 4、负责异构计算芯片(GPU/NPU/ASIC等)的评估、选型以及计算加速引擎设计实现。

更新于 2025-07-22