字节跳动客户重保专家-IaaS
任职要求
1、拥有5年以上公有云/IaaS、PaaS相关稳定性保障、解决方案架构师或客户重保经验中的一项或多项; 2、具备大规模分布式系统、基础设施系统等设计开发或运维保障的实战经验,例如复杂业务场景的流程优化、系统高可用性架构实现等; 3、具备搭建观测系统、抽取指标、调优阈值等思路和实操经验,能够分类提炼故障自愈模式,助力系统实现自动/半自动恢复运行; 4、对问题具备清晰的分析逻辑和全局思维,能够提出建设性思路和解决方案,具备良好的沟通和结构化表达能…
工作职责
1、负责公有云IaaS、PaaS客户稳定性机制的构建工作,涵盖故障观测、响应机制建立、快速止损措施制定以及系统性改进建设,以确保客户线上业务稳定、可靠运行; 2、负责识别当前客户使用云产品全链路环节的可靠性,通过指标量化评估客户系统部署的健康程度,持续优化系统架构,从故障检测、通知与响应机制、自动恢复和止损效率等方面进行提升,增强IaaS产品的可靠性和稳定性; 3、负责推动IaaS&PaaS客户使用云产品最佳实践的落地,借助风险筛查、隐患排查等亚健康观测手段,帮助客户发现资源使用和系统架构方面的改进点,并协同客户团队落实改进措施; 4、持续跟踪业界前沿技术方案,结合IaaS、PaaS相关实际业务场景,不断迭代引入新技术和新方案,如AI OPS、观测降噪和精准,智能辅助运维等。
1、负责公有云IaaS、PaaS客户稳定性机制的构建工作,涵盖故障观测、响应机制建立、快速止损措施制定以及系统性改进建设,以确保客户线上业务稳定、可靠运行; 2、负责识别当前客户使用云产品全链路环节的可靠性,通过指标量化评估客户系统部署的健康程度,持续优化系统架构,从故障检测、通知与响应机制、自动恢复和止损效率等方面进行提升,增强IaaS产品的可靠性和稳定性; 3、负责推动IaaS&PaaS客户使用云产品最佳实践的落地,借助风险筛查、隐患排查等亚健康观测手段,帮助客户发现资源使用和系统架构方面的改进点,并协同客户团队落实改进措施; 4、持续跟踪业界前沿技术方案,结合IaaS、PaaS相关实际业务场景,不断迭代引入新技术和新方案,如AI OPS、观测降噪和精准,智能辅助运维等。
1、负责公有云IaaS、PaaS客户稳定性机制的构建工作,涵盖故障观测、响应机制建立、快速止损措施制定以及系统性改进建设,以确保客户线上业务稳定、可靠运行; 2、负责识别当前客户使用云产品全链路环节的可靠性,通过指标量化评估客户系统部署的健康程度,持续优化系统架构,从故障检测、通知与响应机制、自动恢复和止损效率等方面进行提升,增强IaaS产品的可靠性和稳定性; 3、负责推动IaaS&PaaS客户使用云产品最佳实践的落地,借助风险筛查、隐患排查等亚健康观测手段,帮助客户发现资源使用和系统架构方面的改进点,并协同客户团队落实改进措施; 4、持续跟踪业界前沿技术方案,结合IaaS、PaaS相关实际业务场景,不断迭代引入新技术和新方案,如AI OPS、观测降噪和精准,智能辅助运维等。
负责公共云、AI等项目管理及客户服务工作,以客户成功为目标,带领项目团队完成交付履约,围绕客户AI infra、AI agent,以及上云、用云的整个业务生命周期,提供高质量的交付管理服务,确保项目按合同履约,提升客户满意度,促进增购续费,打造可持续发展的高质量业务增长模式。 工作职责包含但不限于: • 面向阿里云的企业客户,作为项目交付履约的第一责任人,统筹、组建项目交付资源,带领项目团队制定交付和运维方案,并保证项目高质量履约交付; • 售前阶段,配合销售和架构师团队,判断并明确客户需求边界,识别项目潜在风险,评估交付成本,形成高质量可履约的SOW; • 项目交付全程进行管理、监督,对项目风险及问题进行预判、识别及诊断,统筹内外部交付资源,调动区域/行业交付专家资源对重保项目进行全过程项目管理和客户需求对接; • 在交付项目后期协调统筹客户的日常运维,保障运维资源和质量,维护长期客情关系,跟进客户续约需求; • 管理并协同生态伙伴完成项目交付,并对伙伴的项目交付质量进行评估; • 带领项目团队长期陪伴客户上云、用云、用好AI,围绕关键客户形成稳定的服务资源,洞察和响应已有客户需求,并形成解决方案,形成可持续的商业合作。
负责云和AI等方向的项目管理及客户服务工作,以客户成功为目标,带领项目团队完成交付履约,围绕客户AI infra、AI agent,以及上云、用云的整个业务生命周期,提供高质量的交付管理服务,确保项目按合同履约,提升客户满意度,促进增购续费,打造可持续发展的高质量业务增长模式。 工作职责包含但不限于: • 面向阿里云的企业客户,作为项目交付履约的第一责任人,统筹、组建项目交付资源,带领项目团队制定交付和运维方案,并保证项目高质量履约交付; • 售前阶段,配合销售和架构师团队,判断并明确客户需求边界,识别项目潜在风险,评估交付成本,形成高质量可履约的SOW; • 项目交付全程进行管理、监督,对项目风险及问题进行预判、识别及诊断,统筹内外部交付资源,调动区域/行业交付专家资源对重保项目进行全过程项目管理和客户需求对接; • 在交付项目后期协调统筹客户的日常运维,保障运维资源和质量,维护长期客情关系,跟进客户续约需求; • 管理并协同生态伙伴完成项目交付,并对伙伴的项目交付质量进行评估; • 带领项目团队长期陪伴客户上云、用云、用好AI,围绕关键客户形成稳定的服务资源,洞察和响应已有客户需求,并形成解决方案,形成可持续的商业合作。