阿里云阿里云智能-模型服务平台研发专家-机器学习PAI

社招全职5年以上云智能集团2025-09-10地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 计算机相关专业背景，具备五年以上 Golang、Python 或 C++ 中至少一门语言的开发经验；
2. 拥有五年以上的分布式系统开发经验，具备复杂系统的软件设计与调试能力；
3. 精通后端服务开发，熟悉 OpenAPI、微服务架构、Kubernetes、容器技术、Prometheus 等相关技术栈；
4. 熟悉 vLLM、SGLang 等开源推理引擎…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 参与模型服务平台的整体架构设计与核心开发工作，主导大模型多机分布式推理系统的研发与优化，以高效支撑日益增长的业务需求和产品迭代；
2. 负责解决大模型推理过程中高并发场景下的关键技术问题，包括但不限于负载均衡、请求调度、多机组网通信、系统容错机制、KV Cache 高效管理等；
3. 推动模型服务平台的产品化建设，主导或参与大模型分发系统、LLM推理引擎、请求调度系统等核心模块的设计与开发；
4. 负责大规模GPU集群的稳定性与性能优化，构建完善的可观测性系统，提升平台安全性与可靠性，推进资源调度系统的智能化升级；
5. 根据用户反馈快速定位并解决线上问题，深入分析业务需求，将高频使用场景沉淀为平台通用能力，持续提升平台的易用性与功能性。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Go+

Python+

C+++

分布式系统+

OpenAPI+

微服务+

还有更多 •••

登录查看完整学习资料

相关职位

阿里云智能-机器学习平台PAI平台研发专家-AI领域

社招5年以上云智能集团

阿里云PAI团队致力于打造业界一流的一站式AI工程化平台，拥有万卡级训练能力与超大规模异构资源调度技术，为复杂模型训练与推理任务构建坚实基座。PAI平台不仅是通义大模型研发与落地的核心基础设施，也作为公共云服务的关键载体，支撑众多行企业构建大模型核心业务。平台提供从数据标注、预处理、模型训练、推理服务到开发环境与工作流调度的全链路工程支持，全面覆盖AI项目从实验探索到规模化落地的完整价值链。作为平台研发工程师，您将深度参与以下工作： 1. 负责大规模异构资源管理与模型训练服务的全流程开发，包括需求分析、架构设计、软件开发、质量保障与部署上线。 2. 持续开展系统模块的深度剖析与迭代优化，提升资源利用效率、任务成功率与启动速度，降低使用门槛，增强产品满意度与客户粘性。 3. 负责平台线上环境的实时监控、故障定位与性能调优，为客户提供及时的专业技术支持，保障平台服务的高可用与高稳定运行。 4. 紧密追踪大模型、AIGC等前沿技术趋势，洞察并提炼高价值用户需求，推动平台功能持续演进与技术架构升级。

更新于 2025-12-03北京

阿里云智能-机器学习PAI平台研发专家-MLOps/Agent方向（北京、杭州）

社招3年以上云智能集团

1. MLOps平台开发打造一站式大模型开发平台，负责主流开源和闭源模型的训练、评测、蒸馏、压缩、部署全链路工具开发 ● 参与模型各种后训练如微调、蒸馏、强化学习的产品化，以及vLLM/sglang/自研推理引擎的优化，提供有竞争力的推理性能 ● 负责各种MLOps工具链开发，如AI资产管理、实验管理、血缘跟踪、评测对比等，帮助用户串联AI开发全流程，提升模型开发效率 ● 负责多模态数据自动标注和挖掘功能的开发，为智驾和具身智能客户提供新一代的数据工程解决方案 2. 企业级Agent开发平台建设 ● 建设具备全模态能力的agent开发平台，帮助客户构建RAG、chatbot、data agent、design agent、research agent等各种AI agent应用 ● 提供白盒化开发模式，建设全链路的可观测、可调试和监控能力，帮助用户构建同时具备高精度和高性价比的agent应用 ● 针对企业客户对安全隐私的强需求，构建全方位的安全防护能力，包括不限于模型安全护栏、工具沙箱、细粒度权限管控等 ● 与阿里云大数据、智能搜索等业务产品合作，建设阿里云agent工具生态

更新于 2026-01-12北京|杭州

阿里云智能-机器学习平台研发专家-杭州/北京

社招3年以上云智能集团

1. 研发需求洞察与设计：负责阿里云人工智能平台PAI的需求讨论、架构设计、软件开发、功能测试及部署上线，确保项目从初始阶段到交付的全流程高质量执行； 2. 系统优化：从功能、性能、可用性、易用性等多个维度，结合产品设计、产品设计和解决方案架构及客户反馈，进行系统各模块的持续分析和优化，降低用户使用门槛，提升用户满意度和忠诚度； 3. 技术支持与维护：负责线上环境的运行监控与问题定位，与SRE和售后团队紧密协作，及时为客户提供技术支持，保障平台的稳定运行； 4. 前沿技术开发：紧贴大模型及AIGC等业界趋势，提炼并反馈有价值的用户需求，持续增强和改进平台的功能，保持技术的先进性和市场竞争力。

更新于 2025-07-07北京|杭州

千问C端事业群-数据研发专家-杭州

社招5年以上技术类-数据

1. 负责千问智能硬件业务的数据资产建设；联合BI赋能管理决策，共建1+N+N决策数据产品，服务销售，市场，运营，体验，工程，算法等业务场景； 2. 深入理解业务架构和需求，参与智能硬件业务软硬一体的端到端的数据架构设计与建设，包括统一采集、数据资产建设与管理和数据质量及稳定性保障体系等； 3. 深度理解业务，通过对业务策略和痛点的分析，利用数据监控、分析和挖掘等能力，在用户增长、内容运营、商业化运营等业务场景中提供系统性的解决方案并落地 4. 面向智能互联业务场景构建AI数据取数产品，提升组织经营决策效率。 5. 主导或参与湖仓一体的数据架构演进，推动数据采集、治理、质量保障、自动化运维体系的持续优化。

更新于 2026-04-07杭州