腾讯腾讯云-计算Iaas产品SRE工程师
任职要求
1.本科以上学历,具备3年以上开发经验; 至少精通1门开发语言(Python/Go/C/C++); 2.熟悉Linux开发环境,熟悉MYSQL或其他大型数据库,熟悉Web开发框架优先; 3.有运维自动化、监控系统、发布系统、运营支撑系统等开发经验者优先; …
工作职责
1.负责腾讯云基础设施运营平台系统的架构设计和开发,包括监控告警、自动化平台、运营分析和大数据处理集群等系统的开发与维护; 2.通过运维自动化、智能化的建设,提升腾讯云运维效率与质量; 3.通过机器学习、海量数据处理等相关技术,支持腾讯云智能化运维及精细化运营。
1.负责腾讯云公有云客户云上售后SRE专家支持工作,为客户提供容灾高可用,业务部署优化,架构优化,成本优化,容量管理,业务连续性治理等方面的专家服务; 2.帮助客户进行应用部署架构的梳理与优化,通过云产品自身提供的高可用能力或者业界主流的容灾方案,为客户提供容灾高可用优化方案的设计与实施; 3.通过混沌工程等演习手段,设计并实施客户应用业务层面的容灾方案与验证; 4.对常见的互联网IT故障,设计应急预案并工具化落地,帮助客户实现容灾自动化逃生能力,达到客户业务对 RTO/RPO 要求; 5.通过产品化,工具化的思路,提升客户在云上SRE管理与治理方面的体验与效率。
1. 技术方案设计 • 与PD紧密合作,收集、识别、分析客户需求,结合自身行业经验分析并论证需求合理性;在需求明确后,确定技术方案的目标、范围和交付成果; • 完成客户需求的技术方案设计,结合需求场景选择合理的技术架构,满足性能与稳定性要求,并保持足够的可扩展性,同时确保ROI(投入产出比)合理。 2. 技术实现 • 基于DDD(领域驱动设计)开发方法,按时完成弹性网卡(ENI)、安全组(Security Group)业务需求的开发,高质量交付; • 对编码进行阶段性讨论和Code Review,并通过调试优化,推动代码成功部署; • 在Code Review过程中,能够保持热情,及时给予年轻工程师经验指导,帮助其快速成长; • 对开发中和部署后的程序进行维护和迭代,包括值班on-call、升级工单处理、缺陷排查、问题诊断、产品体验改善、性能和成本优化等。 3. 稳定性和性能优化 • 与架构和SRE团队紧密合作,针对负责的功能制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,处理线上疑难杂症问题,确保系统的安全可靠; • 使用DDD(领域驱动设计)开发方法对存量代码进行重构,持续改善系统设计、提升系统性能并消除稳定性隐患。 4. 技术预研 • 定期调研业界对标产品的产品形态并结合客户反馈的业务诉求,分析并转化为ECS弹性网卡、ECS安全组等平台产品的需求;协同PD保持上述产品能力的先进性。 5. 技术规划 • 定期跟踪系统在性能和稳定性相关指标方面的变化趋势,及时分析原因,发现弹性能力演进的机会点,并提前设定技术架构演进的前瞻性目标,开展POC验证; • 对分布式技术、高性能通信技术、数据库技术等保持好奇心和敏锐性,结合业务实际做好技术预研、分享和应用。
1.负责腾讯云公有云客户云上售后SRE专家支持工作,为客户提供容灾高可用,业务部署优化,架构优化,成本优化,容量管理,业务连续性治理等方面的专家服务; 2.帮助客户进行应用部署架构的梳理与优化,通过云产品自身提供的高可用能力或者业界主流的容灾方案,为客户提供容灾高可用优化方案的设计与实施; 3.通过混沌工程等演习手段,设计并实施客户应用业务层面的容灾方案与验证; 4.对常见的互联网IT故障,设计应急预案并工具化落地,帮助客户实现容灾自动化逃生能力,达到客户业务对 RTO/RPO 要求; 5.通过产品化,工具化的思路,提升客户在云上SRE管理与治理方面的体验与效率。
1、负责阿里云海外金融科技行业相关解决方案和售前支持工作,重点满足客户IaaS、PaaS、MaaS、全快联DevOps、云安全、数据库等方面需求,支持BTE达成商业目标。 2、设计、推广标准化的金融科技解决方案,技术开发经验(架构设计、软件开发、SRE),具有云架构方案设计、大数据/数据库、云原生、AI技术领域经验。 3、向客户、合作伙伴和生态系统参与者推广阿里云金融科技领域产品和解决方案,并在金融科技领域建立影响力。 4、为C Level和高级管理人员创建和展示解决方案并获取技术认可。 5、理解金融科技客户、合作伙伴和相关生态的需求,能够提供适当的阿里云金融科技解决方案。 6、熟悉产品和解决方案的设计过程,包括市场分析、产品与解决方案规划,并不断提升产品和解决方案的技术竞争力和销售业绩。