快手搜索推理优化工程师-算法引擎部
任职要求
1、有良好的工程能力,熟练使用c++,精通常见的数据结构与算法,掌握各种编译、调试、性能分析工具; 2、熟悉Tenso…
工作职责
面向快手搜索业务,针对在线推理各个流程(特征、模型等)进行研发与优化; 1、针对搜索业务下的sparse/dense模型进行框架研发与优化,充分压榨GPU的能力; 2、针对推理场景下的特征、embedding查询计算优化,进一步提升CPU的计算效率; 3、支持大模型在搜索场景的落地工作。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。
团队与角色介绍: 我们是国际数字商业集团(AIDC)智能引擎事业群下属的广告引擎团队,致力于构建下一代智能广告技术平台。本岗位将深度参与广告引擎核心系统研发,聚焦在线服务架构优化、算法工程化落地、高并发系统性能调优及稳定性保障体系建设,通过技术创新驱动广告业务增长。 岗位职责: 1. 智能广告引擎架构设计 ○ 主导AIDC广告引擎核心模块的技术架构设计与开发,构建高可用、低延迟的在线服务系统 ○ 推进算法工程化落地,设计与实现特征工程、模型训练、在线推理全链路优化方案 2. 大数据处理平台研发 ○ 开发支持千亿级数据处理的分布式计算框架,优化离线批处理与实时流式计算任务效率 ○ 构建高性能特征存储与计算系统,支持毫秒级实时特征抽取与复杂特征交叉计算 3. 系统工程优化 ○ 主导广告检索/排序/机制模块的性能调优,实现QPS与系统资源利用率的持续提升 ○ 设计多级容灾方案,建立全链路监控体系,保障99.99%+的系统可用性
1. 大模型垂域应用系统的整体架构及业务链路设计,包括但不限于系统设计、算法工程、AIGC应用搭建等; 2. 应用大模型、向量数据库、知识检索、MCP、A2A、 Function calling 等技术,构筑包含 Prompt智能填充、复杂任务规划、大小模型异构调度、数据沉淀和管理的 Agent 平台,用于在游戏开发过程中的能力提效 和游戏智能NPC的开发; 3. 和模型算法同学一起,通过算法和架构结合,改进算法的效果,保证能力的稳定性,降低技术成本; 4. 跟踪最新的智能体技术研究和进展,并在游戏 AI 领域进行创新性探索。