logo of aliyun

阿里云阿里云智能-平台研发专家-GitOps及自动化方向-AI领域

社招全职5年以上云智能集团地点:杭州状态:招聘

任职要求


1、本科及以上学历,计算机或相关专业,5年以上后端或平台开发经验;
2、扎实的计算机基础,精通 Go/Python/Java 中至少一种语言,熟悉常用的云产品及Linux系统操作;
3、熟悉Docker容器等虚拟化技术,了解KubernetesHelm等容器编排技术;
4、有 GitOps 实践经验,熟悉 Argo CD、Flux 或类似工具链,能独立搭建发布流水线;
5、熟悉 IaC(如 Te…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


随着通用人工智能技术的快速发展,算力的需求也越来越大,作为阿里云人工智能平台的核心研发力量,您将负责构建支撑智算中心的自动化交付与运维底座。您的工作直接决定平台的部署效率、稳定性和扩展能力:
1、设计并实现平台的自动化部署系统,支持多地域、多可用区、多租户场景下的高效、高质量交付;
2、主导 GitOps 工作流在团队内的工程化落地,开发和维护基于ArgoCD/Flux等工具的发布控制系统,实现配置即代码、变更可追溯、发布可回滚;
3、参与多种云环境下部署架构的工程实现,解决跨云环境下的配置同步、资源编排与一致性保障问题;
4、与平台产品、算法工程团队紧密协作,将运维能力产品化,提升用户自助部署与管理体验。
包括英文材料
学历+
Go+
Python+
Java+
Linux+
Docker+
Kubernetes+
Helm+
还有更多 •••
相关职位

logo of aliyun
社招5年以上技术类-质量保证

1. 基于云原生技术和GitOps实践,系统化分析和解决阿里云PAI团队在研发中的效率和质量问题,打造易用、高效和可复用的平台工具,提升云产品的持续交付效率。 2. 负责设计、开发和维护提升PAI平台研发效能的工具和系统,包括CI工具、集成测试环境和自动化测试平台等。 3. CI/CD:基于先进的DevOps/GitOps理念,建设一流的CI平台,提升研发体验和效率,实现CI过程可视化、审计和追溯功能。 4. 测试环境:使用Kubernetes、Docker和Golang等云原生技术,构建稳定、高效且易维护的多架构容器化测试环境,提升效率。 5. 自动化测试分层:通过平台工具提升单元测试覆盖率;设计、开发和维护内聚模块的集成测试框架及链路自动化测试框架;设计UI自动化测试,确保核心前端场景的可靠性。 6. 搭建自动化巡检和监控系统,快速响应和解决线上问题,提高服务的稳定性。 7. 根据技术文档和需求,为模块测试、集成测试和系统测试等,构建测试场景、设计测试用例,对测试结果进行分析和评估,发现和跟踪缺陷,并协调开发人员及时解决缺陷问题。

更新于 2025-07-02杭州
logo of aliyun
社招5年以上云智能集团

随着通用人工智能技术的快速发展,GPU算力的需求持续飙升,加入阿里云人工智能平台,您将有机会运用卓越工程理念并实践,构建支撑智算中心的工程底座,为AI智算平台的稳定运行保驾护航: 1. 基于先进的云原生技术和devops理念,系统化分析、设计和解决阿里云PAI团队研发过程中的效率质量问题。 2. CI/CD:基于效能领域先进的GitOps理念,建设一流的CI/CD平台,提升研发体验和效率;沉淀易用、高效、可复用的平台工具,整体提升云产品持续交付的效率。 3. 测试环境维护:使用k8s/docker/golang等云原生技术,建设稳定、高效、易维护的多架构容器化测试环境,提升测试效率。 4. 异常巡检能力:搭建自动化巡检、异常检测与告警联动系统,对预发和线上环境的训练任务、推理服务、平台组件异常进行持续健康监测。

更新于 2025-11-19北京|杭州
logo of bytedance
社招A185770

我们是字节跳动基础架构-私有云团队,主要为今日头条、抖音、国际化短视频、飞书、电商等内部业务提供云基础服务,覆盖服务研发的全生命周期,包括微服务框架、服务发布、服务治理、多云管理以及经营分析平台等方向。团队拥有超大规模的微服务数量、全球化的部署体系、复杂的多云场景。极致的服务性能、简单易用的研发体验、一致的多云管理以及精确的经营分析是团队持续追求的目标。 1、负责云平台的设计与开发工作,负责云平台的基础组件服务,包括但不限于:云服务管控、大规模资源调度系统、商品管理、经营分析、计费计量、报表平台、云平台资源、配额、预算、权限等横向平台建设; 2、抽象多云适配层,适配不同云环境,构建用云过程自助服务,业务通过简单操作,自动完成微服务、配置、存储数据的迁移流程; 3、构建高效稳定的云平台元数据管理服务、云平台构建和高级资源编排服务; 4、负责字节跳动基础架构技术中台交易体系的核心商品域业务需求开发、系统维护,完成需求分析、方案设计和实现; 5、负责商品系统的类目、成本、定价、规格等多个子域的系统设计与维护; 6、负责承载亿级应用程序引擎的研发:负责字节跳动业务架构设计构建高效的在离线服务托管平台; 7、设计研发PaaS/FaaS的关键组件,打造业界领先的无服务器平台Serverless。

更新于 2024-01-16上海
logo of bytedance
社招A134922

我们是字节跳动基础架构-私有云团队,主要为今日头条、抖音、国际化短视频、飞书、电商等内部业务提供云基础服务,覆盖服务研发的全生命周期,包括微服务框架、服务发布、服务治理、多云管理以及经营分析平台等方向。团队拥有超大规模的微服务数量、全球化的部署体系、复杂的多云场景。极致的服务性能、简单易用的研发体验、一致的多云管理以及精确的经营分析是团队持续追求的目标。 1、负责云平台的设计与开发工作,负责云平台的基础组件服务,包括但不限于:云服务管控、大规模资源调度系统、商品管理、经营分析、计费计量、报表平台、云平台资源、配额、预算、权限等横向平台建设; 2、抽象多云适配层,适配不同云环境,构建用云过程自助服务,业务通过简单操作,自动完成微服务、配置、存储数据的迁移流程; 3、构建高效稳定的云平台元数据管理服务、云平台构建和高级资源编排服务; 4、负责字节跳动基础架构技术中台交易体系的核心商品域业务需求开发、系统维护,完成需求分析、方案设计和实现; 5、负责商品系统的类目、成本、定价、规格等多个子域的系统设计与维护; 6、负责承载亿级应用程序引擎的研发:负责字节跳动业务架构设计构建高效的在离线服务托管平台; 7、设计研发PaaS/FaaS的关键组件,打造业界领先的无服务器平台Serverless。

更新于 2024-01-16北京