logo of xiaohongshu

小红书深度学习推理优化工程师-引擎架构

社招全职3年以上后端开发地点:北京 | 上海状态:招聘

任职要求


【岗位要求】
1. 计算机及相关专业本科以上学历,3 年以上高性能系统或 AI Infra 研发经验。
2. 精通 C/C++,具备扎实的系统底层能力(内存、并发、网络),代码风格优雅,热衷技术分享。
3. 深入理解至少一种主流训练/推理框架(XDL、TFRA、DeepRec、TorchRec、DeepSpeed、veRL、Megatron 等),对其执行模型与性能瓶颈有源码级洞察。
4. 熟悉 TensorFlow Serving、TensorRT、OpenXLA、ONNX Runtime 等推理后端,具备大模型量化、编译优化与线上 A/B 调优实战经验。
5.…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


【岗位职责】
1. 主导新一代训练与推理引擎的架构设计与核心模块开发,支撑搜广推业务在长序列建模、生成式推荐、Agent 等前沿场景的规模落地。
2. 与存储、数据平台深度协同,打造端到端 ML 数据 Pipeline:统一特征管理、秒级调试、版本追踪与一键上线,让数据科学家专注模型创新。
3. 持续优化训推基础设施:自研 Embedding 高速存储、特征 DSL 引擎、弹性调度与服务化推理框架,实现 10x 级性能提升。
4. 跟踪 LLM / Agent 最新进展,将其工程化落地到搜索、广告、推荐及智能体业务,定义行业新标准。
包括英文材料
C+
C+++
编程规范+
TensorFlow+
PyTorch+
Transformer+
大模型+
Ray+
TensorRT+
还有更多 •••
相关职位

logo of xiaohongshu
校招引擎

1、参与模型训练与推理引擎的架构设计与核心模块开发,基于 TensorFlow / PyTorch 打造业界领先的训练-推理引擎,支撑长序列建模与生成式推荐等新一代模型架构升级; 2、对接存储与数据平台团队,搭建统一的 ML 数据 Pipeline,提供特征管理、开发调试、版本控制与高效生产等平台化能力; 3、负责训推基础设施核心模块的研发与性能优化,包括但不限于 Embedding 管理组件、特征 DSL 引擎、服务化调度与推理框架; 4、关注业界前沿 LLM / Agent 等模型与系统架构,探索其在搜索与推荐业务中的工程化落地方案。

更新于 2025-08-30北京|上海
logo of xiaohongshu
校招引擎

1. 主导新一代训练与推理引擎的架构设计与核心模块开发,支撑搜广推业务在长序列建模、生成式推荐、Agent 等前沿场景的规模落地。 2. 与存储、数据平台深度协同,打造端到端 ML 数据 Pipeline:统一特征管理、秒级调试、版本追踪与一键上线,让数据科学家专注模型创新。 3. 持续优化训推基础设施:自研 Embedding 高速存储、特征 DSL 引擎、弹性调度与服务化推理框架,实现 10x 级性能提升。 4. 跟踪 LLM / Agent 最新进展,将其工程化落地到搜索、广告、推荐及智能体业务,定义行业新标准。

更新于 2025-09-04北京|上海
logo of meituan
社招核心本地商业-业

1. 负责到家搜索推荐机器学习引擎的工程架构工作,包括 CTR/LLM 模型训练/推理优化、 用户特征平台建设等; 2. 建设面向多场景、高性能、可拓展的机器学习引擎,支撑外卖/闪购/医药/营销等场景的搜索推荐业务需求; 3. 持续优化工程架构,提升系统性能表现、算力规模以及迭代效率; 4. 调研业界前沿技术发展动态,结合业务实际情况,实现在业务的落地

更新于 2025-04-17北京
logo of meituan
社招核心本地商业-业

1. 负责到家搜索推荐机器学习引擎的工程架构工作,包括 CTR/LLM 模型训练/推理优化、 用户特征平台建设等; 2. 建设面向多场景、高性能、可拓展的机器学习引擎,支撑外卖/闪购/医药/营销等场景的搜索推荐业务需求; 3. 持续优化工程架构,提升系统性能表现、算力规模以及迭代效率; 4. 调研业界前沿技术发展动态,结合业务实际情况,实现在业务的落地

更新于 2025-03-07北京