logo of aliyun

阿里云阿里云智能-机器学习PAI平台研发专家-MLOps/Agent方向(北京、杭州)

社招全职3年以上云智能集团地点:北京 | 杭州状态:招聘

任职要求


基本要求:
1. 本科及以上学历,计算机相关专业
2. 3年以上机器学习平台工程或大模型算法开发经验
3. 熟练掌握至少一门编程语言(Java/Python/C++/GO),有扎实的计算机基础和研发背景
4. 精通后端服务开发,掌握OpenAPI微服务k8s、容器等相关知识和技能
5. 良好的表达、沟通和团队协作能力
6. 对技术有激情,喜欢钻研,具备良好的学习能力

加分项:
1. 熟悉llm/vlm/文生图/文生视频等各种大模型的训练算法和主流的推理框架架构
2. 熟悉容器安全技术(gVisor/Kata Containers沙盒机制)
3. 有分布式系统设计、开发以及运维经验
4. 有实际机器学习端到端开发和业务落地经验者尤佳

工作职责


1. MLOps平台开发打造一站式大模型开发平台,负责主流开源和闭源模型的训练、评测、蒸馏、压缩、部署全链路工具开发
● 参与模型各种后训练如微调、蒸馏、强化学习的产品化,以及vLLM/sglang/自研推理引擎的优化,提供有竞争力的推理性能
● 负责各种MLOps工具链开发,如AI资产管理、实验管理、血缘跟踪、评测对比等,帮助用户串联AI开发全流程,提升模型开发效率
● 负责多模态数据自动标注和挖掘功能的开发,为智驾和具身智能客户提供新一代的数据工程解决方案

2. 企业级Agent开发平台建设
● 建设具备全模态能力的agent开发平台,帮助客户构建RAG、chatbot、data agent、design agent、research agent等各种AI agent应用
● 提供白盒化开发模式,建设全链路的可观测、可调试和监控能力,帮助用户构建同时具备高精度和高性价比的agent应用
● 针对企业客户对安全隐私的强需求,构建全方位的安全防护能力,包括不限于模型安全护栏、工具沙箱、细粒度权限管控等
● 与阿里云大数据、智能搜索等业务产品合作,建设阿里云agent工具生态
包括英文材料
学历+
机器学习+
大模型+
算法+
Java+
Python+
C+++
Go+
OpenAPI+
微服务+
Kubernetes+
分布式系统+
相关职位

logo of aliyun
社招5年以上云智能集团

1. 参与模型服务平台的整体架构设计与核心开发工作,主导大模型多机分布式推理系统的研发与优化,以高效支撑日益增长的业务需求和产品迭代; 2. 负责解决大模型推理过程中高并发场景下的关键技术问题,包括但不限于负载均衡、请求调度、多机组网通信、系统容错机制、KV Cache 高效管理等; 3. 推动模型服务平台的产品化建设,主导或参与大模型分发系统、LLM推理引擎、请求调度系统等核心模块的设计与开发; 4. 负责大规模GPU集群的稳定性与性能优化,构建完善的可观测性系统,提升平台安全性与可靠性,推进资源调度系统的智能化升级; 5. 根据用户反馈快速定位并解决线上问题,深入分析业务需求,将高频使用场景沉淀为平台通用能力,持续提升平台的易用性与功能性。

更新于 2025-09-10
logo of aliyun
社招3年以上云智能集团

1. 研发需求洞察与设计:负责阿里云人工智能平台PAI的需求讨论、架构设计、软件开发、功能测试及部署上线,确保项目从初始阶段到交付的全流程高质量执行; 2. 系统优化:从功能、性能、可用性、易用性等多个维度,结合产品设计、产品设计和解决方案架构及客户反馈,进行系统各模块的持续分析和优化,降低用户使用门槛,提升用户满意度和忠诚度; 3. 技术支持与维护:负责线上环境的运行监控与问题定位,与SRE和售后团队紧密协作,及时为客户提供技术支持,保障平台的稳定运行; 4. 前沿技术开发:紧贴大模型及AIGC等业界趋势,提炼并反馈有价值的用户需求,持续增强和改进平台的功能,保持技术的先进性和市场竞争力。

更新于 2025-07-07
logo of aliyun
社招3年以上云智能集团

1.负责基于AI云平台,构建高效、易用的大模型/多模态大模型算子工具库,包括数据处理,预训练,SFT,模型蒸馏,强化学习等链路,并将云上的AI能力赋能给客户; 2. 基于上述AI算法开发工具链,研发大模型/多模态大模型算法在ChatBI,AI Agent,自动驾驶,具身智能等典型应用场景的最佳实践,对算法效果、性能进行持续优化; 3. 具备将业务问题转化成算法实现问题,帮助客户解决实际问题的能力;能与企业客户深度沟通,通过对业务的深入理解,将不同用户对算法的需求抽象成标准工具,达到能快速复制的效果; 4. 持续跟踪大模型/多模态大模型算法技术本身的业界动态,在算法效果/效率方面持续创新,沉淀学术影响力

更新于 2025-09-10
logo of xiaohongshu
社招2年以上机器学习平台

部门介绍: 小红书的AI技术中台目前由AI技术部负责建设,通过标准化的AI技术能力提供支持公司各个业务团队(包括社区,交易,商业化,广告,agi),实现AI能力的共享和复用,提升技术资源的利用率和公司的创新迭代速度,并降低技术成本和稳定性风险。 工作职责: 作为小红书AI技术部 智能调度开发工程师: 1、负责机器学习系统资源智能调度的设计和开发,服务于各方向(搜广推核心场景、LLM场景等)的模型训练、模型评估和模型推理; 2、通过调度技术、引擎技术提升在离线资源分配和利用效率,并提升训练、推理性能,支持公司业务的快速发展。 3、通过对机器学习平台的架构升级和产品迭代,大幅提升算法同学的模型迭代效率。 4、打造具有业界一流水平的机器学习技术,通过开源共建等各类形式,提升团队与个人在业界的影响力。