logo of aliyun

阿里云阿里云智能-容器应用及交付平台技术专家-杭州

社招全职5年以上云智能集团地点:杭州状态:招聘

任职要求


1. 5年以上javagolang开发经验,掌握语言特性,掌握主流数据库、缓存消息队列中间件的使用及原理
2. 具备良好的抽象设计能力,熟练使用常用设计模式,有一定的系统或模块设计经验
3.…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责容器应用平台的架构设计与开发,构建业内领先的PAAS平台,完成应用接入以及云的建站部署
2. 负责K8S组件以及Operator的设计与开发,为容器应用的部署运维阶段提供相应的能力
3. 负责容器应用平台自身性能、稳定性、可扩展性等领域的持续演进
包括英文材料
Java+
缓存+
消息队列+
中间件+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能集团

1. 负责容器应用平台的架构设计与开发,构建业内领先的PAAS平台,完成应用接入以及云的建站部署 2. 负责K8S组件以及Operator的设计与开发,为容器应用的部署运维阶段提供相应的能力 3. 负责容器应用平台自身性能、稳定性、可扩展性等领域的持续演进

更新于 2025-07-10杭州
logo of tongyi
社招8年以上技术类-开发

1. 作为技术负责人,制定并推动多模态交互系统的端云整体工程架构演进路线,覆盖端侧推理、客户端集成、云端服务及协同策略。 2. 主导端侧AI推理框架的设计与优化,包括模型加载、算子加速、内存管理、功耗控制、异构计算(CPU/GPU/NPU)调度等,确保大模型在资源受限设备上的高效运行。 3. 负责Android客户端核心交互模块的架构设计与开发,包括多模态输入采集、实时通信、状态管理、离在线切换、异常恢复等关键能力。 4. 设计高并发、低延迟、可扩展的云端推理服务架构,支持语音识别、大模型生成、多模态融合等服务的弹性部署与动态扩缩容。 5. 构建端云协同机制,实现任务卸载、上下文同步、模型热更新、A/B测试等能力,提升系统整体鲁棒性与迭代效率。 6. 带领应用工程团队,负责关键技术方案评审、核心模块编码、性能压测、线上稳定性保障及团队技术能力建设。 7. 与算法、产品、芯片、测试及客户解决方案团队紧密协作,推动系统从原型验证到规模化商用落地。

更新于 2025-11-20北京|杭州
logo of aliyun
社招5年以上云智能集团

1. 负责阿里云容器产品管控系统的架构设计、功能开发和运维管理,打造稳定易用的容器服务管理平台。 2. 维护高性能、高可用的阿里云容器管控服务,保障业务系统在全球地域的稳定性。 3. 深入参与产品全生命周期研发管理,持续优化提升产品安全、稳定、性能、功能与用户体验,以技术驱动业务增长。 4. 推动系统架构演进及优化,关注前沿技术发展,完成技术预研和技术难点攻关。

更新于 2025-09-09北京|杭州
logo of aliyun
社招5年以上云智能集团

1、运维可观测链路建设 • 对稳定性有全局化的思考能够制定稳定性方案并落地; • 事前:建立并持续优化应用运维的监控机制,研发并维护相应的运维监控平台/工具; • 事中:建立并持续优化应用运维的预警机制,确保故障能够被快速发现、快速定位、快速处置; • 事后:快速分析、诊断、定位问题,并能够协同相关人员解决问题;建立健全快速恢复服务机制,降低业务受损程度,确保业务稳定运行;通过稳定性治理专项、架构优化等排除潜在风险。 2、稳定性运维平台建设 • 设计、研发并维护可靠的运维平台、工具,如巡检系统、水位系统、交付系统、成本管理系统等,帮助解决生产系统遇到的交付、性能、稳定性、成本等问题,保障业务持续可用,提升性能与效率; • 负责运维质量数据化分析工作,通过对日常运维指标、问题、风险进行分析和研究,建立模型,给出运维优化建议; 3、应用运维规范标准建设 • 建设应用运维流程规范以及标准化(如变更标准、重保方案、云产品配置标准等),确保运维的规范性和标准化,提升运维稳定性; • 制定应用运维的故障应急处置规范标准; • 制定应用运维的报警处置规范标准以及SLA; • 制定应用运维的成本把控规范以及考核标准。 4、资源调优 • 基于业务需求规划,进行预算编制、容量规划与准备,协调研发进行存储、计算等资源消耗的预测与估算; • 分析业务需求,在确保稳定性的前提下,结合水位和规格以及计费规则等,并把控技术方案中资源估算合理性,协同研发降低资源成本。 5、安全保障建设 • 7*24应急响应,日常监控报警和应急处置并对存在的问题持续发现并整改; • 负责重大节点(如国庆、春节、元旦)的运维保障工作; • 应急预案的制定及演练、应急响应和故障处理等事项; • 建立问题/故障记录库,对记录库进行针对性分析,补齐并优化应急预案库和规范流程库; • 配合安全团队,梳理安全漏洞,优化相关技术架构,提升系统的安全性。 6、架构升级 • 负责系统架构升级,如内核升级、网络架构升级、服务跨机房迁移、容器化改造等; • 持续挖掘云产品的功能以及使用能力结合业务需求场景进行优化; • 负责容灾架构设计并实施,如同城容灾、异地多活等。

更新于 2025-09-03北京|杭州