携程资深测试开发工程师(SRE组)(MJ030736)
任职要求
具备良好的学习能力、分析和解决问题的能力;具有良好的团队合作精神、积极主动沟通意识;熟悉Linux环境,熟练使用常用命令;熟练某个编程语言如:Java/Python/Go,有实际项目开发经验者优先…
工作职责
负责前端团队的质量保障、效率提升;负责提升UI自动化框架的稳定性和性能和框架相关功能迭代;负责产研生产运营工具的开发;负责研发产线测试提效工具的研发。

线上问题处理:牵头处理线上故障,协调各方,确保快速恢复 时效工具建设:开发工具来缩短问题的定位和解决时间(如:智能排障平台、一键预案工具) 智能定位设计:设计并引入AI工具,实现问题的自动发现和智能根因定位 质量与监控建设:构建并维护监控体系,通过流程和工具有效识别并预防问题
1 系统设计与架构:主导业务系统的架构设计,针对业务需求制定技术架构方案,保证系统的扩展性、高性能与高可用性。同时,负责对现有系统进行性能优化和架构升级。2 功能开发与代码实现:产品需求开发,包括详细设计、编码、单元测试、集成测试等,确保系统功能的实现和交付。3 性能优化与安全保障:对后端系统进行性能监控和分析,以及SRE相关工作。负责系统的安全防护工作,保障系统数据安全和业务安全。4 技术选型与前沿探索:推进新技术的调研和落地,技术难题攻坚与优化。
我们正在寻找一名资深CI/CD 系统开发专家,专注于 Hologres 实时数据仓库引擎的持续集成与持续交付系统的开发与优化。Hologres 是阿里巴巴自研的实时数据仓库引擎,支持海量数据的高并发、低延迟查询,广泛应用于实时数据分析、报表展示、BI 分析等场景。 你将参与构建和优化 Hologres 的自动化构建、测试、部署和发布系统,推动Hologres研发部署流程高效、稳定、可扩展。该岗位对系统架构、工程能力和技术深度有较高要求,适合有大型分布式系统 CI/CD 经验的高级工程师或架构师,或者有大数据系统研发经验的高级工程师。
泰山平台是支撑云原生团队稳定和质量的技术风险平台,目前已经支持数十个地域、数千个集群、百万规模的规模容器运维。在智能测试、智能运维的领域有前沿探索,和多所国内知名学校有长期的项目合作,主导混沌工程领域的开源建设。 1、基于AI技术升级技术风险平台产品,包括不限于自动化测试生成、规模化容器运维、多模态告警降噪、容器根因诊断、韧性工程等领域,深度参与或主导AI框架与工程架构设计,并推动AI产品落地; 2、探索大模型与智能体技术在技术风险领域的创新应用,推动AI驱动的自动化技术风险能力升级,大幅提升测试、观测、应急等效能; 3、不断研究大模型的新的前沿技术,攻克关键技术难题,促进安全AI技术发展; 4、结合AI行业发展趋势,制定合适的技术发展规划,提升团队技术视野和技术影响力。