logo of xiaohongshu

小红书大模型与 Agent 平台全栈工程师/专家

社招全职3-5年基础后端地点:北京 | 上海状态:招聘

任职要求


任职要求:
1、本科及以上学历,计算机、软件工程、人工智能等相关专业优先。
2、具备优秀的代码能力,熟悉 Go / Java / Python 中至少一门语言,具备良好的工程实现能力、代码质量意识和系统抽象能力。
3、具备扎实的计算机基础,理解操作系统、数据结构算法、数据库、网络、分布式系统等基础知识。
4、熟悉云原生和后端技术栈,包括 KubernetesDocker微服务架构、MySQLRedisMQSQL 等,有高可用、高并发、可观测系统建设经验优先。
5、了解大模型训练、推理、部署、评估及 Agent 应用开发基本流程,熟悉 Prompt Engineering、Tool Calling、Function Calling、RAG、Workflow 编排、Memory、多轮对话、模型评估等相关概念,有实际开发经验优先。
6、熟悉 AI 编程工具和 AI Native 研发方式,能够高效使用 Claude Code、Codex、Cursor 等工具辅助需求分析、代码开发、测试生成、问题排查和工程重构,具备利用 AI 工具提升复杂…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


工作职责:
1、大模型与 Agent 平台架构研发:负责大模型平台、Agent 应用平台的架构设计和核心功能研发,构建云原生架构下高可用、高性能、可扩展的微服务体系,支撑模型能力从训练、部署到业务应用的端到端落地。
2、AI 生产链路与 LLMOps 建设:建设面向大模型全流程的 LLMOps / DevOps 能力,覆盖模型训练、模型管理、推理部署、服务发布、监控告警、任务诊断、效果评估等环节,提升大模型生产效率和稳定性。
3、Agent 应用平台建设:参与建设面向业务研发和算法团队的 Agent 开发平台,支持 Agent Workflow、Tool Calling、Function Calling、MCP、RAG、Memory、多轮对话、调试诊断、应用发布等核心能力,降低大模型应用开发和上线门槛。
4、Pipeline 与任务编排系统建设:负责大模型任务流、Pipeline、Argo Workflows / Kubeflow 等任务编排能力建设,提升训练、部署、评估、Agent 应用构建等复杂任务的自动化、可观测和可恢复能力。
5、平台与框架深度结合:将平台能力与训练、推理、部署、Agent Framework 深度结合,通过任务调度、弹性容灾、失败重试、资源隔离、链路追踪、性能优化等能力,端到端提升 AI 生产效率。
6、平台体验优化及业务协同:持续优化 AI 平台和 Agent 应用平台的易用性、稳定性和开发者体验,与算法、推理、训练、云原生、业务研发等团队协作,将平台能力沉淀为可复用、可规模化的标准化能力。
包括英文材料
学历+
Go+
Java+
Python+
数据结构+
算法+
分布式系统+
Kubernetes+
Docker+
微服务+
SQL+
MySQL+
Redis+
消息队列+
高可用+
还有更多 •••
相关职位

logo of ctrip
社招旅游业务开发

负责大规模语言模型(LLM)及其他AI模型的在线服务部署、性能调优与推理加速,确保高并发、低延迟、高可用的模型服务。负责设计和开发智能Agent运行框架,实现核心模块,包括不限于知识库存储与检索(RAG)、Agent的长短期记忆存储、对接多模型协作协议(如MCP/A2A)等新型交互机制。探索和落地模型压缩、量化、动态批处理、服务化框架优化(Triton/TorchServe等)等推理优化技术。负责搜索推荐算法工程后端系统的设计、开发和维护,保障系统稳定高效运行,实现高并发在线特征工程、模型推理服务集成和服务质量监控等核心模块。负责系统架构的设计、优化及核心模块的代码实现(Java为主)。与产品经理、算法工程师、前端工程师紧密协作,理解需求,设计技术方案并推动落地。负责系统的日常维护、监控、故障排查和性能调优。

更新于 2025-08-26上海
logo of ctrip
社招旅游业务开发

负责大规模语言模型(LLM)及其他AI模型的在线服务部署、性能调优与推理加速,确保高并发、低延迟、高可用的模型服务。负责设计和开发智能Agent运行框架,实现核心模块,包括不限于知识库存储与检索(RAG)、Agent的长短期记忆存储、对接多模型协作协议(如MCP/A2A)等新型交互机制。探索和落地模型压缩、量化、动态批处理、服务化框架优化(Triton/TorchServe等)等推理优化技术。负责搜索推荐算法工程后端系统的设计、开发和维护,保障系统稳定高效运行,实现高并发在线特征工程、模型推理服务集成和服务质量监控等核心模块。负责系统架构的设计、优化及核心模块的代码实现(Java为主)。与产品经理、算法工程师、前端工程师紧密协作,理解需求,设计技术方案并推动落地。负责系统的日常维护、监控、故障排查和性能调优。

更新于 2025-08-27上海
logo of xiaohongshu
社招3-5年后端开发

#为什么2026年你会感谢自己选了这个岗? 小红书电商GMV 150%+年复合增速,每少损失1个点假货/刷单,就是几亿到账保护。 这里不是传统风控,而是全球最复杂的社区电商治理战场:3亿月活、千万级买手&商家、百亿交易笔记、直播实时弹幕、UGC内容即商品,一处失守就是全网舆情。 你将从Day1起就用代码+大模型决定10万+商家生死、亿级用户信任,影响力直达交易与商业化最高决策层,简历直接从“普通后端”升级成“治理+Agent双专家” #专属成长加速包(专为渴望成长速度快于同龄人的你量身定制) - 加入后12-18个月成为业界最稀缺的“电商治理+多智能体”复合型专家; - 扁平化文化,优秀的人天然会被赋予更大责任、更广权限、最核心的项目,成长完全取决于你的能力和产出; - 深度实践全球最前沿的大模型+多Agent在真实亿级治理场景的落地(智能稽查Agent、纠纷仲裁机器人、商家风险画像、自动宣教闭环、假货多模态识别等),比纯大模型岗更硬、更能出成果; - 薪资直接对标T0/T0.5梯队,快速增值的期权为你的收入上个超强buff,房补、三餐、补充商保全配齐; #你每天会做的事(技术爽点+业务影响力双爆表) - 设计并落地超大规模、可秒级热更新的规则引擎 + 多智能体协同框架,让黑灰产无处遁形; - 打造全球领先的大模型驱动的可解释处置平台 + 人机协同审核体系,把仲裁效率提升10倍+; - 建设实时大数据情报感知中心,用多Agent对抗千万级黑灰产,守护每一笔真实交易; - 探索Agent在商家宣教、信用评价、纠纷调解中的全链路自动化,做出刷爆行业的SOTA案例; - 持续演进高可用、高并发治理中台,扛住大促期间单日数百亿~千亿次治理调用,峰值QPS 20万+的极端流量冲击;

更新于 2026-01-27上海|杭州
logo of xiaohongshu
社招5-10年前端开发

【团队介绍】 我们是小红书前端架构团队,作为支撑全公司(社区、电商、商业化、直播等)前端业务的底层技术基石,致力于打造高效、优雅的研发工具链与基础设施。 🚀 新挑战:全面拥抱 AI-Native。 研发模式正在经历范式转移,我们正面向 AI-Friendly 的基础架构进行核心产品重构。这不仅是工具的升级,更是对下一代大前端研发体验的重新定义。 🌱 高成长:扁平、务实、高杠杆。 小红书全面推行扁平化管理,取消职级限制,让能力和产出成为唯一的通行证。在这里,你的每一行基建代码、每一次架构调优,都将直接影响数千名工程师的“研发幸福感”与业务迭代速度。我们提供充足的探索空间,让高潜同学在技术深度与业务影响力的双轨上实现加速成长。 - 重构极致的研发基建: 结合业界前沿技术与小红书业务体量,设计并落地极速的前端 CI/CD 系统与工具链。通过对构建编译(Rspack/Vite等)的极致性能压榨、灵活的流水线编排,企业级的质量风险控制,实现质量与效率的最佳平衡,为 AI Agent 提供稳定、明确、可调用的底层研发环境; - 定义 AI-Friendly 的工程架构: 定义工程架构与研发流程规范,提供服务机制能力,实现大前端研发 harness 约束与能力调用,实现 Agent 研发模式的推进建设;同时借助 AI 能力,实现在自动化排障、归因分析、代码生成、质量检查 Review 等场景的增强; - 技术赋能与业务破局: 协同内外部团队攻克技术深水区,用极客精神追根溯源,将技术突破转化为可度量的业务收益,打造业界一流的技术实现。

更新于 2026-04-02上海|杭州