logo of bytedance

字节跳动运维平台技术专家/架构师-计算

社招全职5年以上A193982地点:西安状态:招聘

任职要求


1、5年以上公有云/IaaS/计算相关设计开发经验/运维经验/性能调优/客户重点保护一项或多项;
2、有平台化产品、分布式系统等设计开发或运维保障实战经验;
3、能够独立完成架构设计、技术选型、方案评审,具备跨团队技术协调能力;
4、熟悉云…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责弹性计算、容器、异构等业务场景的智能化运维平台建设,包括资源巡检、风险识别、智能诊断等系统,推进1-5-10故障自愈能力建设,支撑超大规模集群的稳定性建设,提升复杂故障的秒级定位和止损能力;
2、识别平台架构中的技术瓶颈与风险,制定技术演进路线,推动架构升级与技术栈迭代,保障平台的稳定性与安全性;
3、持续跟进业界技术趋势,并结合IaaS、云原生等业务场景引入新技术和新方案,包括但不限于AI提效、智能运维等技术趋势。
包括英文材料
IaaS+
性能调优+
分布式系统+
还有更多 •••
相关职位

logo of aliyun
社招8年以上技术类-开发

1、承担MaxCompute管控系统架构师角色,负责产品技术架构演进方向 2、面向全球不同客户设计合理的产品方案,梳理存储、计算、售卖、控制台、运维体系架构,确定技术方案选型 3、承担MaxCompute管控系统设计、研发、测试、发布与运维 4、与MaxCompute各研发团队+SRE中台团队+阿里云售卖平台配合,共同推进技术项目按要求落地

更新于 2025-04-02杭州
logo of aliyun
社招技术类-开发

1、参与文件存储管控平台建设,与产品团队、架构师团队合作进行架构设计,为管控系统朝着易部署、易交付、易运维的方向持续优化; 2、负责建设文件存储管控系统的高可用体系,包括流量均衡、自适应容灾切换、自动降级等,提升系统在典型故障场景下的自运维、自恢复能力,确保生产业务的持续稳定; 3、持续提升文件存储管控系统的用户体验,深入理解文件存储的业务,解决客户使用文件存储产品中的痛点和难点,改进不合理的设计,提升产品易用性。

更新于 2025-04-15成都|北京|杭州
logo of aliyun
社招5年以上技术类-综合

● 负责公有云交付架构和平台工具的规划设计,通过部署架构优化、部署工具和体系建设来提升全流程交付部署效率 ● 持续提升云平台及其系统组件的可交付能力,建立知识库、交付工具、交付流程优化及方法论 ● 负责公有云新Region/AZ交付项目全链路交付实施,识别和屏蔽实施前技术风险 ● 基于平台和数据的持续建设,推动交付平台工具优化,提升云产品自动化交付能力;并设计和输出交付平台的独立部署、版本管理等能力

更新于 2025-04-14北京|杭州
logo of aliyun
社招8年以上云智能集团

1、技术方案设计 - 负责 ABM 运维平台的架构设计,具有前瞻性视野,满足业务快速发展和各种输出环境适配需求。 2、技术实现 - 负责ABM核心模块的开发和优化,满足大规模和高性能的需求。 - 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署。 - 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、体验改善、性能和成本优化等。 3、稳定性和性能优化 - 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠。 - 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能。 4、技术预研 - 跟踪和了解新的产品技术和趋势,根据业务需要提供技术支持和建议。 5、技术规划 - 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。

更新于 2026-01-12杭州