logo of kuaishou

快手搜索推理优化工程师-算法引擎部

社招全职3-5年J0012地点:北京状态:招聘

任职要求


1、有良好的工程能力,熟练使用c++,精通常见的数据结构与算法,掌握各种编译、调试、性能分析工具;
2、熟悉Tenso…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


面向快手搜索业务,针对在线推理各个流程(特征、模型等)进行研发与优化;
1、针对搜索业务下的sparse/dense模型进行框架研发与优化,充分压榨GPU的能力;
2、针对推理场景下的特征、embedding查询计算优化,进一步提升CPU的计算效率;
3、支持大模型在搜索场景的落地工作。
包括英文材料
C+++
数据结构+
还有更多 •••
相关职位

logo of xiaohongshu
社招5-10年引擎

我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。

更新于 2026-03-28上海|北京
logo of alibaba
社招3年以上技术类-开发

团队与角色介绍: 我们是国际数字商业集团(AIDC)智能引擎事业群下属的广告引擎团队,致力于构建下一代智能广告技术平台。本岗位将深度参与广告引擎核心系统研发,聚焦在线服务架构优化、算法工程化落地、高并发系统性能调优及稳定性保障体系建设,通过技术创新驱动广告业务增长。 岗位职责: 1. 智能广告引擎架构设计 ○ 主导AIDC广告引擎核心模块的技术架构设计与开发,构建高可用、低延迟的在线服务系统 ○ 推进算法工程化落地,设计与实现特征工程、模型训练、在线推理全链路优化方案 2. 大数据处理平台研发 ○ 开发支持千亿级数据处理的分布式计算框架,优化离线批处理与实时流式计算任务效率 ○ 构建高性能特征存储与计算系统,支持毫秒级实时特征抽取与复杂特征交叉计算 3. 系统工程优化 ○ 主导广告检索/排序/机制模块的性能调优,实现QPS与系统资源利用率的持续提升 ○ 设计多级容灾方案,建立全链路监控体系,保障99.99%+的系统可用性

更新于 2025-04-01北京
logo of kuaishou
社招3-5年J0012

1. 大模型垂域应用系统的整体架构及业务链路设计,包括但不限于系统设计、算法工程、AIGC应用搭建等; 2. 应用大模型、向量数据库、知识检索、MCP、A2A、 Function calling 等技术,构筑包含 Prompt智能填充、复杂任务规划、大小模型异构调度、数据沉淀和管理的 Agent 平台,用于在游戏开发过程中的能力提效 和游戏智能NPC的开发; 3. 和模型算法同学一起,通过算法和架构结合,改进算法的效果,保证能力的稳定性,降低技术成本; 4. 跟踪最新的智能体技术研究和进展,并在游戏 AI 领域进行创新性探索。

更新于 2025-07-15杭州
logo of xiaohongshu
社招3年以上客户端开发

1、负责小红书端侧智能框架的设计与开发,支撑端侧AI模型/策略的动态加载、升级,容器的组合编排与功能热插拔,实现资源与体验的最优平衡,覆盖首页、搜索、详情页、互动玩法、创作工具等核心场 2、承担AI模型在iOS端落地的前沿技术预研与攻坚,如大型语言模型(LLM)端侧轻量化部署、多模型协同推理、智能策略等,推动AI技术在小红书产品中的创新应用 3、与算法、服务端、产品、设计团队紧密协作,定义AI模型在端侧应用的需求,设计端云协同动态化技术方案,保障用户体验的流畅与智能

北京|上海