米哈游AI 平台工程师
任职要求
1. 设计、开发并运营 AI 后端服务(推理请求处理、会话与流式传输、限流/熔断、配额与计费等)。 2. 提升高并发与流式 I/O(HTTP/WebSocket/SSE)的处理能力,进行基准测试、容量规划与性能优化。 3. 建立工程质量保障:代码评审、单元/集成/负载测试与故障演练;完善接口与技术文档。 4. 构建与维护交付流程:发布流水线、灰度/回滚、变更管理;落实监控、告警与值班。 5. 负责存储层的建模与查询优化,定位慢查询与热点问题,提升端到端响应效率。 6. 与算法与产品协作,定义清晰的 API 契约,推动需求落地与效果验证。 加分项 1. 计算机相关专业本科及以上,”1–3 年“ Python 后端经验,具备可维护工程落地能力。 2. 精通Python 3.10+ 异步编程(asyncio),熟悉 FastAPI / Starlette等异步框架与类型提示。 3. 扎实的网络…
工作职责
参与设计、实现与运营面向大规模推理与数据流的 **AI 后端服务**,重点保障稳定性、性能与可观测性,支持业务与算法的快速迭代落地。
我们正在寻找一位具备深厚技术能力,有志于在内容安全领域持续深耕的资深工程师,负责小红书内容安全平台的架构设计和开发,将内容安全平台与AI深度结合,利用AI能力重构内容安全审核模式,支撑亿级用户规模下内容安全工程链路建设。 具体职责包括: 1、负责内容安全各类场景化Agent的后端开发,支持AI系统架构搭建 2、负责内容安全模型平台的功能开发和稳定性保障,高质量系统开发,包含亿级DAU产品的数据流,运营系统、审核系统等平台开发 3、持续探索AI在内容安全场景的应用,利用AI能力增强内容安全能力,提升工程效率
我们正在寻找有经验的 AI 基建开发工程师,负责构建企业级 AI 基础设施,包括 AIGW(AI Gateway / 大模型接入与运维)、智能 NPC 平台、MCP Hub 等关键 AI 基础设施的设计、开发和运维工作。您将参与大模型接入、能力编排、性能优化、评估体系建设以及成本管理等全链路工作,帮助业务更高效地使用大模型。 您将与 AI 应用、业务研发、平台团队紧密协作,构建稳定、高性能、可扩展的大模型服务体系。 主要职责: 1. 负责 AIGW(AI Gateway)的大模型接入、路由、限流、监控、运维体系建设与优化。 2. 实现并维护与主流大模型服务(OpenAI、Anthropic、Gemini、DeepSeek 等)的 API 集成体系。 3. 参与大模型能力评估:效果评测、推理性能优化、模型选型对比、成本分析与优化。 4. 构建并维护 LLM 应用相关的工具链,包括 Prompt 模板管理、RAG 访问层、评测框架。 5. 优化模型调用策略(缓存、多模型路由、降级策略、并发调度)。 6. 支持业务团队落地 AI 应用,协助完成模型选型、评估、接入、调试与规范化接入。 7. 编写并维护平台技术文档、接入文档、最佳实践与标准。 8. 持续跟进生成式 AI、大模型推理、Agent/MCP、模型加速等领域的最新进展并应用于平台。
小红书中台AI平台团队致力于打造业界领先的一站式AI平台,通过技术创新和工程优化,为公司AI业务发展提供强有力的基础设施支撑,实现算法研发效率的显著提升和成本的有效控制。我们负责调度公司所有AI模型训练及推理的数万卡GPU资源,基于自研的训练、推理、智能体框架,为公司所有算法及工程同学提供端到端、一站式的AI研发能力,包含大模型数据处理/训练/压缩/推理/部署及开箱即用的API体验、AI知识库/智能体应用构建、搜广推数据生产/模型训练/模型上线/特征管理/模型测试等。 1、负责大模型/搜广推模型开发平台、AI应用开发平台的架构设计和核心功能研发,构建云原生架构,设计高可用、高性能的微服务体系; 2、负责构建面向大模型、搜广推、智能体全流程DevOps,与下游云原生平台深度融合,支撑大模型在公司内各业务生产链路稳定高效地落地; 3、负责万卡规模GPU集群效能分析及优化,通过调度策略优化、在离线混部、GPU虚拟化、存储&网络加速等手段,提升GPU集群使用效率; 4、将平台和框架结合,通过任务调度、弹性容灾、性能优化等措施端到端提升AI生产效率,涉及k8s/kubeflow、网络通信、分布式训练等; 5、优化各AI平台性能,提升系统稳定性和可扩展性,保障大规模并发场景下的服务质量与用户体验; 6、持续研究分析业内创新AI平台产品,优化技术方案,改进产品功能,提升创新能力与产品体验。