logo of kuaishou

快手多元算力AI优化工程师

社招全职D8950地点:北京状态:招聘

任职要求


1、对AI领域的基本理论与常见模型算法,有深刻的理解;
2、熟练使用tensor flow或pytorch,进行模型训练或推理优化;
3、有使用GPU做AI算法加速相关经历,熟悉GPU C…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


从事AIGC相关领域的平台级软硬件解决方案开发与性能优化工作,具体包括以下二者或二者之一:
1、大规模训练集群在LLM模型训练负载下的性能分析与相关优化工作;
2、AIGC主流模型(SD/类Sora)在训练/推理侧的性能分析与优化工作。
包括英文材料
算法+
PyTorch+
还有更多 •••
相关职位

logo of kuaishou
社招D8950

从事AIGC相关领域的硬件解决方案开发与性能优化工作,具体包括以下二者或二者之一: 1、大规模训练集群在LLM模型训练负载下的性能分析与相关优化工作; 2、业界AIGC主流模型在推理侧的性能分析与优化工作。

更新于 2025-02-17上海
logo of kuaishou
社招D13084

1、跟踪业界最新强化学习领域算法/训练范式进展,完成大模型强化学习训练框架的设计与实现,提升大集群分布式训练性能,缩短模型迭代周期; 2、负责大模型SFT/蒸馏训练框架的设计与实现,提升分布式训练性能; 3、负责分布式大模型推理引擎的方案设计与实现,快速完成业界Sota模型的规模化上线服务; 4、负责异构计算芯片(GPU/NPU/ASIC等)的评估、选型以及计算加速引擎设计实现。

更新于 2025-07-22北京
logo of xiaohongshu
社招3-5年引擎

【业务介绍】 作为公司统一的模型训练引擎团队,支撑公司内所有搜推广类业务的训练工程侧工作,包括模型训练、参数服务器、特征样本流水线等,通过引擎能力的持续建设结合多元异构算力为业务提供高效、灵活、稳定的搜广推模型服务。 为公司核心的搜广推业务提供关键的模型训练引擎支撑,解决超大规模稀疏特征训练的核心问题,不断挖掘异构硬件算力,为公司搜广推业务增长提供保障,并获得快速的成长与提升。 【岗位职责】 1、负责小红书搜广推业务线的机器学习训练框架的研发与迭代,核心支持公司所有相关业务场景; 2、深入参与分布式训练、自动并行化、参数服务器、特征样本流水线等系统底层功能的创新设计与优化,实现软硬件协同的极致训练效率; 3、跨团队合作,与公司算法部门深度协同,针对关键项目开展算法与系统的联合优化,推动解决实际业务挑战; 4、推动自动化扩展、智能资源调度、跨架构设备兼容(NV GPU、GPGPU、XPU等)、AI系统可观测性等先进技术在公司模型训练平台落地; 5、跟踪并推动AI系统领域的最新技术趋势(如生成式推荐、AI编译优化、RDMA/NCCL通信计算并发等),持续保持平台业界领先优势。

更新于 2025-11-11北京|上海
logo of baidu
社招1年以上ACG

-负责云原生产品 Kubernetes 容器引擎、镜像服务、可观测服务等的设计与研发工作,提升产品竞争力及体验 -负责大规模 AI Infra 云原生底座的设计与研发工作,基于云原生技术打造异构多元芯算力底座,支持国产化信创,支持业务进行大规模训练、容错及弹性推理,构建异构多元芯算力底座 -负责打造现代化的云原生智能运维能力,设计和实现覆盖 AI 场景全栈的故障感知、诊断及自愈能力 -持续提升云原生产品服务及基础设施的稳定性,优化服务性能,提升架构的可扩展性 -探索业界最新技术方向,参与开源社区,提升百度云原生核心竞争力

更新于 2025-04-28北京|上海