小红书AI平台推理引擎研发工程师

社招全职3-5年引擎2025-10-22地点：上海 | 深圳状态：招聘

扫码手机上打开

任职要求

1、优秀的代码能力、数据结构和基础算法功底，熟悉C++开发，理解大规模分布式应用系统和平台；
2、熟悉至少一种主流的深度学习训练或推理框架（TensorFlow / PyTorch / Onnx / TensorR…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、参与/负责研发面向大规模稀疏参数机器学习模型的等推理服务框架；
2、通过并行计算优化、分布式架构优化、异构调度等多种框架技术，打造高效、易用、领先的AI推理框架；
3、与全公司各业务算法部门深度合作，为重点项目进行算法与系统的联合优化，支撑业务目标达成；
4、深度参与周边深度学习系统多个子方向的工作，包括但不限于模型管理、推理部署、日志/监控、推荐系统等；

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

数据结构+

算法+

C+++

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

AI平台研发工程师（Infra方向）-校招

校招技术

团队介绍团队长期深耕AI算法研发、AI基础架构建设、AI服务应用打造，负责从AI算法研发、性能优化加速、工程服务化与云端部署、服务调度与资源优化、到服务管理与运维在内的完整AI落地运用流程，覆盖线上数据到模型训练、训练模型到线上服务的闭环。近期重点聚焦AIGC在公司内容团队和产研团队的使用，通过大模型的能力，持续推动爱奇艺在内容创作、生产、分发、以及用户体验上的创新、优质、高效、自动化与智能化。欢迎愿意长期深耕AI领域的同学加入我们！工作职责 - 参与AI工程服务化工作，将算法团队研发的AI能力初始原型进行服务化，落地成为业务团队线上稳定可用的AI应用 - 参与大模型训练平台、推理平台建设，包括但不限于分布式训练框架调优、推理引擎优化、模型量化及加速等 - 参与AI基础设施建设，包括计算资源管理、网络架构设计、存储系统优化等，提升资源利用率，降低大模型研发与应用成本 - AI领域最新进展的技术调研、引入改造、原型设计与开发等

更新于 2026-03-26上海

【转正实习】大模型推理引擎研发工程师

实习核心本地商业-基

1.负责LLM大语言模型的推理优化； 2.负责机器学习引擎的编译优化工作； 3.负责模型稀疏化和模型量化工作。

更新于 2025-02-26北京|上海

大模型引擎研发工程师(实习)

实习核心本地商业-基

1.围绕大模型异构训练集群，尤其是非NV GPU大规模异构硬件集群，面向大模型预训练、Finetune等场景进行新模型使能，系统分析/优化，业务支撑等工作，包括分布式优化框架，AI框架，网络集合通信，算子等方面内容； 2.负责大模型推理引擎的研发和优化，包括推理系统优化、模型量化压缩和模型部署； 3. 熟悉NLP类模型训练场景，有GPT，LlaMa、DeepSeek等相关知识和经验者优先 4. 熟悉视觉类，多模态大模型训练场景，有ViT， Swin Transformer, Stable Diffusion, MoE相关知识和经验者优先 5. 熟悉Megatron, Deepspeed, Colossal AI, FSDP等分布式框架，有相关知识、使用和调优经验者优先 6. 熟悉以下推理框架者优先，如FasterTransformer、vllm、sglang、LMDeploy、TensorRT-LLM等； 7. 熟悉PyTorch分布式场景，有二次开发经验，系统调优知识和经验者优先 8. 熟悉集合通信原理和基本知识，对NCCL有大规模使用，调优经验者优先 9. 熟悉算子开发流程，有CUDA编程知识和相关经验者优先 10. 熟悉NV GPU架构，对其他类型AI芯片有使用经验者优先

更新于 2025-04-07北京|上海

微信-后台开发高级工程师-机器学习工程方向

社招2年以上微信APP基础体

1.研究AI模型推理加速技术在微信业务中的应用，参与TFCC服务平台和推理引擎的研发与优化，提升推荐模型、大模型、传统中小模型等业务场景的推理性能； 2.负责微信后台AI算法的工程应用与优化，支持语音识别、语音合成、视觉理解、大语言模型等业务的后台工程开发与优化； 3.跟进AI领域的最新动态，优化内部技术方案，提升平台性能，推进AI架构升级。

更新于 2026-02-03广州