logo of xiaohongshu

小红书深度学习推理优化-搜广推

社招全职1-3年引擎地点:北京 | 上海状态:招聘

任职要求


1. 计算机及相关专业本科以上学历,1-3年服务端开发工作经验,学习能力强,有高并发高可用系统设计研发经验。
2. 精通C/C++,具备扎实的系统底层能力(内存、并发、网络),有大型系统开发经验。
3. 良好的架构设计能力和团队合作精神,能独立承担任务,有把控项目进度的能力,工作有…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


【部门介绍】引擎架构部提供小红书搜广推,CV和NLP业务的深度学习模型高性能推理服务。主导SOTA推理引擎的架构设计与核心模块开发,支撑搜广推业务在长序列建模、生成式推荐、Agent等前沿场景在GPU,XPU等异构计算部件上规模落地。

1. 参与搜广推预估链路的架构设计和研发,推动预估链路架构演进,提升算法研发/迭代效率,保障搜广推预估链路整体稳定性。
2. 根据搜广推的特征和样本,构建大规模在离线特征/样本计算引擎,支撑批式/流式场景的特征/样本计算和分析。
3. 能深入理解产品和业务,满足算法与产品在模型工程上的需求,解决搜广推算法工程化的问题,支撑业务快速发展。
4. 分析现有预估链路的不足,定位预估链路瓶颈,提升预估链路整体性能。
包括英文材料
学历+
高并发+
高可用+
系统设计+
C+
还有更多 •••
相关职位

logo of xiaohongshu
社招3年以上引擎

【部门介绍】引擎架构部提供小红书搜广推,CV和NLP业务的深度学习模型高性能推理服务。主导SOTA推理引擎的架构设计与核心模块开发,支撑搜广推业务在长序列建模、生成式推荐、Agent等前沿场景在GPU,XPU等异构计算部件上规模落地。 1. 参与推理引擎的架构设计与核心模块的开发。持续优化推理基础设施:特征DSL编译引擎、服务化推理框架,实现性能提升。 2. 优化搜广推、长序列、多模态、MoE等深度学习模型的推理效率,将各场景的推理性能优化到极致。 3. 针对GPU/NPU等异构计算芯片,探索片内多部件并行流水线等前沿技术,构建业界影响力。

更新于 2026-04-02北京|上海
logo of xiaohongshu
社招3年以上引擎

【部门介绍】引擎架构部提供小红书搜广推,CV和NLP业务的深度学习模型高性能推理服务。主导SOTA推理引擎的架构设计与核心模块开发,支撑搜广推业务在长序列建模、生成式推荐、Agent等前沿场景在GPU,XPU等异构计算部件上规模落地。 1. 参与推理引擎的架构设计与核心模块的开发,参与AI编译器前后端的设计与实现,优化IR Compile模式下DSL特征处理引擎和AI推理引擎的性能。 2. 分析I/O性能瓶颈、优化编译耗时和codegen性能,改进编译优化算法,不断优化编译器,解决编译部署问题。 3. 优化IR Compile模式下搜广推、长序列、多模态、MoE等深度学习模型的推理效率。 4. 针对GPU/NPU等异构计算芯片,探索基于IR编译优化的片内多部件并行流水线等前沿技术,构建业界影响力。

更新于 2026-04-02北京|上海
logo of xiaohongshu
社招3年以上后端开发

【岗位职责】 1. 主导新一代训练与推理引擎的架构设计与核心模块开发,支撑搜广推业务在长序列建模、生成式推荐、Agent 等前沿场景的规模落地。 2. 与存储、数据平台深度协同,打造端到端 ML 数据 Pipeline:统一特征管理、秒级调试、版本追踪与一键上线,让数据科学家专注模型创新。 3. 持续优化训推基础设施:自研 Embedding 高速存储、特征 DSL 引擎、弹性调度与服务化推理框架,实现 10x 级性能提升。 4. 跟踪 LLM / Agent 最新进展,将其工程化落地到搜索、广告、推荐及智能体业务,定义行业新标准。

更新于 2026-04-02北京|上海
logo of xiaohongshu
校招引擎

1. 主导新一代训练与推理引擎的架构设计与核心模块开发,支撑搜广推业务在长序列建模、生成式推荐、Agent 等前沿场景的规模落地。 2. 与存储、数据平台深度协同,打造端到端 ML 数据 Pipeline:统一特征管理、秒级调试、版本追踪与一键上线,让数据科学家专注模型创新。 3. 持续优化训推基础设施:自研 Embedding 高速存储、特征 DSL 引擎、弹性调度与服务化推理框架,实现 10x 级性能提升。 4. 跟踪 LLM / Agent 最新进展,将其工程化落地到搜索、广告、推荐及智能体业务,定义行业新标准。

更新于 2025-09-04北京|上海