腾讯TCE稳定性治理高级工程师
任职要求
1.本科及以上学历,5年以上IT/互联网行业工作经验; 2.熟悉云计算IaaS/PaaS常用架构,具备3年以上云计算经验,掌握同城多活、异地容灾等容灾架构方案; 3.熟悉专有云的技术架构体系,了解云基础设施的配置规划与部署,有私有云项目交付经验者优先; 4.掌握Python/go等后台开发语言,熟悉linux内核技术栈,掌握shell脚本编程; 5.具备全局意识和体系化思维,能将复杂问题抽象和分解,识别共性问题和关键问题; 6.具有良好的沟通技巧和ownership,具有优秀的团队合作精神、敬业精神。 加分项 1.对云计算领域有深厚的理论基础和实践经验,有参与过大型云计算项目架构设计的经验者优先; 2.在开源社区中有积极贡献,或在业界有较高的技术影响力者优先; 3.在同等条件下,通过腾讯云认证或取得同等资格认证的候选人,我们会优先考虑。
工作职责
1.负责分析TCE整体技术架构设计,识别潜在稳定性风险,提出优化方案; 2.设计并实施高可用/容灾/小型化方案,参与稳定性专项工具的开发并基于工具推动解决横向问题; 3.负责云平台底座及云产品的部署架构、升级架构、运维架构、容量模型等专项方案设计与推进; 4.支撑专有云项目交付,解决项目中遇到到架构问题,基于现网问题举一反三,推动整体优化。
1.负责腾讯TCE专有云的运维保障,包括交付、监控、变更、应急响应和故障恢复; 2.负责腾讯TCE专有云站点建设、发布部署、监控巡检和变更管控等运维体系的建设,对效能提升有深刻的理解和实践; 3.为腾讯TCE专有云产品的稳定、高效运行负责,支撑专有云整体业务快速发展; 4.具备研发能力,通过研发解决运维体系的稳定性、效率和成本管理等问题。
1.负责制定并执行专有云版本管理规范,包括版本管理流程、版本发布计划、版本测试计划、版本发布说明等,确保版本的正常输出; 2.负责制定并执行版本升级规范,协调产研团队、交付团队、运维团队按照规范实施,确保版本升级的顺利进行; 3.负责制定并执行软件版本生命周期管理规范,包括版本规划、版本设计、版本开发、版本测试、版本发布、版本维护、EOM和EOS等,推动版本生命周期管理的有效实施; 4.负责私有化产品版本的需求管理与推进,与客户沟通收集需求并制定合理的版本计划,同时与产品经理、研发等部门紧密合作,推动需求的准时落地; 5.负责私有化产品版本的质量控制,结合版本规划与测试团队制定完善的测试计划,确保版本质量符合要求; 6.负责私有化产品版本的用户反馈收集和分析,推动版本不断改进; 7.负责私有化产品版本管理工具的选型和使用,建立版本管理流程和规范,提高版本管理效率和质量; 8.负责私有化产品版本管理相关文档的编写和维护,包括版本计划、版本发布说明、版本测试报告等。
1.负责腾讯TCE专有云产品针对国产化信创替换方向的规划和设计:; 2.需要积极接触有潜在替换可能性的客户及其前后端团队,了解友商客户的使用场景和痛点,并转化为产品需求,提供具有前瞻性的产品规划和设计; 3.需要深入了解跨云迁移替换过程中的计算、网络、存储等相关功能的底层原理和特性方案,能够向一线团队提供全面的产品支撑; 4.需要根据产品功能需求设计可用易用的产品方案和原型; 5.针对跨云迁移的平稳过渡设计产品演进路线和未来规划,可以很好的将客户的场景和自身相结合。