网易AI 平台工程师（AI Infra / AI Platform Engineer）

社招全职3年以下网易游戏（互娱）2025-12-02地点：广州状态：招聘

扫码手机上打开

任职要求

1. 计算机相关专业本科及以上学历，有 AI / ML / NLP 背景优先。
2. 2 年以上软件开发经验，具备平台类或后端系统开发经验。
3. 熟练掌握 Python / Go 至少一种语言（二者皆熟练优先）。
4. 熟练使用 MongoDB、Redis，具备良好的数据建模与缓存实践经验。
5. 熟悉 Web 开发框架（Flask、FastAPI 等）及 RESTful API 设计与实现。
6. 熟悉 Linux 环境，可独立使用 Dock.er 完成开发、部署、运维与故障排查。
7. 熟悉大模型基本原理，了解大模型推理机制与常用模型（OpenAI、Anthropic 等）特性。
8. 具备 提示工程、RAG 实践经验，了解其优势、限制及适用场景。
9. 熟悉 AI Coding 工具（如 GitHub Copilot、Cursor、Windsurf）并可…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

我们正在寻找有经验的 AI 基建开发工程师，负责构建企业级 AI 基础设施，包括 AIGW（AI Gateway / 大模型接入与运维）、智能 NPC 平台、MCP Hub 等关键 AI 基础设施的设计、开发和运维工作。您将参与大模型接入、能力编排、性能优化、评估体系建设以及成本管理等全链路工作，帮助业务更高效地使用大模型。
您将与 AI 应用、业务研发、平台团队紧密协作，构建稳定、高性能、可扩展的大模型服务体系。

主要职责：
1. 负责 AIGW（AI Gateway）的大模型接入、路由、限流、监控、运维体系建设与优化。
2. 实现并维护与主流大模型服务（OpenAI、Anthropic、Gemini、DeepSeek 等）的 API 集成体系。
3. 参与大模型能力评估：效果评测、推理性能优化、模型选型对比、成本分析与优化。
4. 构建并维护 LLM 应用相关的工具链，包括 Prompt 模板管理、RAG 访问层、评测框架。
5. 优化模型调用策略（缓存、多模型路由、降级策略、并发调度）。
6. 支持业务团队落地 AI 应用，协助完成模型选型、评估、接入、调试与规范化接入。
7. 编写并维护平台技术文档、接入文档、最佳实践与标准。
8. 持续跟进生成式 AI、大模型推理、Agent/MCP、模型加速等领域的最新进展并应用于平台。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

NLP+

Python+

Go+

MongoDB+

Redis+

缓存+

Web+

开发框架+

Flask+

还有更多 •••

登录查看完整学习资料

相关职位

AI Infra平台-研发工程师

社招3-5年J0012

1、面向AI应用场景设计开发业界领先的AI平台，包括prompt工程，RAG工程、模型微调、推理加速等能力； 2、负责大模型场景下多领域的数据工程，包含知识库数据的高质量处理，Prompt提示词的优化，模型微调数据集的质量提升； 3、负责大模型场景下模型推理框架的性能优化方案的设计与实现； 4、设计训练和优化大模型，跟踪和研发代码大模型的预训练、持续训练、SFT、RLHF等技术； 5、设计与实现AI智能体应用的编排定义，提升企业应用的智能度。

更新于 2025-12-19杭州|北京

AI Infra平台研发工程师（大模型开发机方向）-Seed

社招A149874A

团队介绍：字节跳动Seed团队成立于2023年，致力于寻找通用智能的新方法，追求智能上限，为科技和社会发展作出贡献。 Seed团队在AI领域拥有长期愿景与决心，团队研究方向涵盖MLLM、GenMedia、AI for Science、机器人等，在中国、新加坡、美国等地设有实验室和岗位；目前，团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、即梦、TRAE等超过50个应用场景，并通过火山引擎开放给企业客户；第三方数据显示，豆包App用户量在中国市场排名第一，豆包大模型日均Token调用量行业领先。 1、负责大模型平台开发机的后端系统设计与研发，包括开发机生命周期管理、用户权限与资源隔离等能力； 2、设计和优化基于Kubernetes的资源编排与调度体系，支持CPU/GPU、共享存储、网络、镜像等复杂资源管理场景，跟进云原生、AI Infra、GPU调度、分布式训练、AI Agent等方向的技术演进，并推动在平台中的落地； 3、建设面向算法研发的云端开发体验，包括VS Code Server、SSH、Web IDE、任务环境复用、镜像管理、数据挂载等能力； 4、负责平台核心架构设计与工程化建设，提升系统的稳定性、可扩展性、可观测性和运维效率，包括服务治理、监控告警、日志链路、故障诊断、灰度发布、容量规划和成本优化； 5、与算法、训练平台、基础架构、运维等团队协作，持续提升大模型研发效率和资源利用率。

更新于 2026-06-09上海

AI Infra推理平台工程师【2027届校招】

校招其他

岗位简介加入我们，你将负责自动驾驶大模型从实验室到车端落地的关键一环——构建高吞吐、低延迟的推理服务平台。你会接触到业界最前沿的推理引擎（TensorRT、SGLang、vLLM）、KV Cache 共享与 P/D 分离架构，以及面向多模态大模型（VLM）的异构推理优化，直接影响自动驾驶系统的实时感知与决策能力。推理服务化平台建设：参与构建高可用的模型推理服务平台，支持 LLM / VLM 等模型的服务化部署、弹性扩缩容与多租户隔离。推理引擎深度优化：基于 TensorRT、TorchScript、SGLang、vLLM 等框架进行推理性能优化，探索 INT8/FP8 量化、算子融合、动态 Batch 等加速手段。 KV Cache 与显存管理：参与设计高效的 KV Cache 管理策略（如 Mooncake / LMCache 方案），支持长上下文场景下的显存高效利用与跨实例共享。 P/D 分离与推理架构：参与 Prefill-Decode 分离架构的设计与实现，优化首 token 延迟与整体吞吐，支撑自动驾驶场景下的实时交互需求。端云协同推理：探索车端（Thor / Orin 等）与云端协同推理方案，参与模型轻量化、蒸馏与边缘部署优化。

更新于 2026-07-07深圳|广州|北京

AI Infra训练平台工程师【2027届校招】

校招其他

岗位简介加入我们，你将参与国内头部自动驾驶公司万卡级GPU训练集群的构建与优化，直接支撑端到端自动驾驶大模型的训练迭代。在这里，你会深入PyTorch编译器、CUDA Kernel、NCCL通信库的最底层，解决千卡训练中的线性度瓶颈、显存墙和故障快速定位等硬核挑战。分布式训练框架开发：参与大规模分布式训练任务的调度、编排与执行框架开发，支持数据并行、模型并行、流水线并行及混合并行策略。训练性能极致优化：基于 PyTorch 2.x / Torch Compile / Triton 进行训练性能分析与优化，探索 FP8 混合精度、自定义 CUDA 算子、通信计算重叠等前沿加速方案。训练稳定性保障：构建训练故障自动检测与恢复机制（慢节点定位、RDMA 异常检测、Checkpoint 智能管理），保障千卡任务长期稳定运行。数据与存储优化：优化海量训练数据（视频、点云、图像）的预处理 Pipeline 与存储读取性能，降低数据加载对GPU利用率的影响。 GPU 集群资源调度：参与基于 Kubernetes 的 GPU 虚拟化与调度平台建设，提升集群资源利用率与任务并发度。

更新于 2026-07-07深圳|广州|北京