快手多元算力AI优化工程师

社招全职D89502025-06-05地点：北京状态：招聘

扫码手机上打开

任职要求

1、对AI领域的基本理论与常见模型算法，有深刻的理解；
2、熟练使用tensor flow或pytorch，进行模型训练或推理优化；
3、有使用GPU做AI算法加速相关经历，熟悉GPU C…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

从事AIGC相关领域的平台级软硬件解决方案开发与性能优化工作，具体包括以下二者或二者之一：
1、大规模训练集群在LLM模型训练负载下的性能分析与相关优化工作；
2、AIGC主流模型(SD/类Sora)在训练/推理侧的性能分析与优化工作。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

算法+

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

多元算力AI优化工程师（上海）

社招D8950

从事AIGC相关领域的硬件解决方案开发与性能优化工作，具体包括以下二者或二者之一： 1、大规模训练集群在LLM模型训练负载下的性能分析与相关优化工作； 2、业界AIGC主流模型在推理侧的性能分析与优化工作。

更新于 2025-02-17上海

多元算力AI计算引擎工程师/专家

社招D13084

1、跟踪业界最新强化学习领域算法/训练范式进展，完成大模型强化学习训练框架的设计与实现，提升大集群分布式训练性能，缩短模型迭代周期； 2、负责大模型SFT/蒸馏训练框架的设计与实现，提升分布式训练性能； 3、负责分布式大模型推理引擎的方案设计与实现，快速完成业界Sota模型的规模化上线服务； 4、负责异构计算芯片（GPU/NPU/ASIC等）的评估、选型以及计算加速引擎设计实现。

更新于 2025-07-22北京

搜广推 - 训练框架研发工程师 / 专家

社招3-5年引擎

【业务介绍】作为公司统一的模型训练引擎团队，支撑公司内所有搜推广类业务的训练工程侧工作，包括模型训练、参数服务器、特征样本流水线等，通过引擎能力的持续建设结合多元异构算力为业务提供高效、灵活、稳定的搜广推模型服务。为公司核心的搜广推业务提供关键的模型训练引擎支撑，解决超大规模稀疏特征训练的核心问题，不断挖掘异构硬件算力，为公司搜广推业务增长提供保障，并获得快速的成长与提升。【岗位职责】 1、负责小红书搜广推业务线的机器学习训练框架的研发与迭代，核心支持公司所有相关业务场景； 2、深入参与分布式训练、自动并行化、参数服务器、特征样本流水线等系统底层功能的创新设计与优化，实现软硬件协同的极致训练效率； 3、跨团队合作，与公司算法部门深度协同，针对关键项目开展算法与系统的联合优化，推动解决实际业务挑战； 4、推动自动化扩展、智能资源调度、跨架构设备兼容（NV GPU、GPGPU、XPU等）、AI系统可观测性等先进技术在公司模型训练平台落地； 5、跟踪并推动AI系统领域的最新技术趋势（如生成式推荐、AI编译优化、RDMA/NCCL通信计算并发等），持续保持平台业界领先优势。

更新于 2025-11-11北京|上海

混合云云原生底座研发工程师（J84846）

社招1年以上ACG

-负责云原生产品 Kubernetes 容器引擎、镜像服务、可观测服务等的设计与研发工作，提升产品竞争力及体验 -负责大规模 AI Infra 云原生底座的设计与研发工作，基于云原生技术打造异构多元芯算力底座，支持国产化信创，支持业务进行大规模训练、容错及弹性推理，构建异构多元芯算力底座 -负责打造现代化的云原生智能运维能力，设计和实现覆盖 AI 场景全栈的故障感知、诊断及自愈能力 -持续提升云原生产品服务及基础设施的稳定性，优化服务性能，提升架构的可扩展性 -探索业界最新技术方向，参与开源社区，提升百度云原生核心竞争力

更新于 2025-04-28北京|上海