logo of aliyun

阿里云阿里云智能-AI管理平台架构与研发专家-北京/杭州

社招全职3年以上云智能集团地点:北京 | 杭州状态:招聘

任职要求


1、本科及以上学历,在云平台开发、AI领域有经验者优先考虑;
2、要求3年以上Java开发的经验,Java基础扎实,熟悉io、多线程、分布式、缓存、消息等机制;熟悉kubernetes相关原理并能做operator的扩展开发和运维;
3、在AI大模型领域有较系统的研究或开发经验,如大模型训练框架、大模型应用与优化、异构算力管理等;
4、具备系统思考、逻辑分析能力,善于跨团队沟通与协调,对技术问题有清晰的分析逻辑和全局思维。
备注:持有阿里云ACA/ACP/ACE认证证书者优先

工作职责


1、参与AI管理平台的产品功能规划、设计与研发,实现AI资源、资产管理以及提供AI训练、推理服务;
2、关注AI前沿发展,面向AI开发流程,设计从模型到异构算力的灵活调度和极致效率,打造“云+AI”的云原生AI PaaS平台;
3、面向大规模、分布式的智算场景,实现数据加速、训练弹性、模型推理优化、模型部署优化等平台能力。
包括英文材料
学历+
Java+
多线程+
缓存+
Kubernetes+
大模型+
相关职位

logo of aliyun
社招8年以上云智能集团

阿里云专有云是面向政企行业客户的全栈云平台,为企业级客户(政府、金融、部委、央企等行业)提供产品和服务。该岗位主要负责专有云平台资源管理与运营方向的规划、设计及产品研发。核心职责包括: 1、 贴近专有云政企客户的场景与需求,规划、设计、研发专有云平台的资源管理与运营能力等; 2、在保证稳定、安全的前提下,通过AI能力赋能运营,提升用户的管云与用云效率; 3、紧跟行业发展趋势与动态,参与行业标准制定,致力于打造专有云平台管理与运营的行业领导力。

更新于 2025-09-11
logo of aliyun
社招5年以上云智能集团

1. 负责阿里云容器服务系列控制台的前端架构设计与核心功能开发,打造稳定、高效、易用的容器服务管理平台。 2. 主导前端系统架构演进,推动工程化体系建设,落地微前端、性能优化、体验治理等关键技术。 3. 深入参与产品研发管理,持续优化产品稳定安全与用户体验,以技术驱动业务增长。 4. 关注前端前沿技术发展,主导前端新技术的预研与技术难点攻关,探索 AI 与前端融合及研发提效。

更新于 2025-09-03
logo of aliyun
社招5年以上云智能集团

我们正在寻找一位充满激情、经验丰富的高级技术专家,加入我们的创新团队,共同面对并解决在Serverless GPU和AI应用平台领域中的挑战性问题。 1.负责Serverless计算及AI应用托管平台的架构设计与持续优化。包括异步事件处理、GPU资源调度与弹性伸缩,AI 应用和模型托管等核心功能的设计。保障系统的高可用性、可扩展性和安全性。 2.理解业务战略及重点,并进行相应的技术架构规划并推动落地。能够为开发团队提供专业的技术指导和支持。推动分布式系统、AI应用托管等领域的知识共享和技术创新。 3.深入分析系统性能瓶颈,实施有效的优化策略,提高系统响应速度和资源使用效率。 4.加强与产品、开发、运维等部门的合作,确保技术方案的有效实施,克服项目推进中的各种障碍。 5.为关键客户提供技术支持,针对使用Serverless平台过程中出现的难题给予及时有效的解决方案,维护良好的产品体验。

更新于 2025-09-09
logo of aliyun
社招5年以上技术类-开发

1. 建设灵骏在专属云场景监管控系统核心能力,不断提升专属云客户在云上使用灵骏智算集群产品的自动化、智能化程度。 2. 建设满足专属云业务场景和数据合规要求的智算集群库存管理体系,结合节点调度、性能分析、故障自动化处理、租户运维功能等核心体系能力,持续提升灵骏智算集群产品在专属云市场的产品竞争力。 3. 结合专属云特殊基础设施情况,建设智算集群和管控系统自身高可用体系,如智算集群健康检测、节点与集群异常快速处置体系、管控组件故障自动定位、自动恢复、自适应容灾、云原生技术实施及落地等,保障业务持续可用、保障线上系统稳定性。 4. 建设异构算力统一管理及资源调度系统,持续智算集群资源利用率、降低计算成本。 5. 持续跟踪AI智算、云原生及智能运维领域新技术,结合业务场景进行创新。 6. 该职位涉及值班响应的职责,在服务级别协议(SLA)时间内做出对客响应,推动客户问题的解决,改善客户体验。

更新于 2025-06-30