京东SRE工程师
社招全职运维工程师岗地点:北京状态:招聘
任职要求
1.负责保障公司系统、应用和服务的高可用性、可靠性和性能,设计、实施和维护监控系统,及时发现并解决潜在问题;
2.快速响应和解决生产环境中的故障,确保系统正常运行;
3.开发和维…登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.本科及以上学历,计算机科学、信息技术或相关专业背景; 2.5年以上系统运维、性能优化、故障排查等相关经验; 3.熟练使用自动化运维工具,具备Golang、Python、Shell等脚本编程经验; 4.深入了解云计算、容器化技术(如Docker、Kubernetes); 5.具备强大的故障排除和问题解决能力,能够在高压环境下迅速应对; 6.有大型分布式系统的设计和维护经验者优先。
包括英文材料
高可用+
https://redis.io/blog/high-availability-architecture/
A high available architecture is when there are a number of different components, modules, or services that work together to maintain optimal performance, irrespective of peak-time loads.
https://www.ibm.com/think/topics/high-availability
High availability (HA) is a term that refers to a system’s ability to be accessible and reliable close to 100% of the time.
相关职位
社招3年以上ACG
-负责百度云CDN&边缘计算平台的资源交付、容量管理及大规模分布式集群的架构设计工作,构建行业领先的资源平台 -负责百度云CDN&边缘计算自动化运维平台发布实践、实现CI/CD全流程管控,打造智能化运维平台提升效率及产品服务稳定性 -负责百度云CDN&边缘计算业务运营、指标体系建设 -负责百度云CDN&边缘计算大客户解决方案落地及质量调优工作
更新于 2025-03-31北京
社招3-5年网易游戏(互娱)
1. 负责GitLab、SVN、Perforce等版本管理工具的日常维护,参与相关工具的二次开发和定制化功能开发。 2. 负责持续集成(CI)、持续交付(CD)流水线的设计、优化和自动化管理,推动DevOps最佳实践落地。 3. 参与并推动公司各类开发、测试工具链的集成与自动化流程建设,提升研发效率和交付质量。 4. 参与应用日志采集、监控与报警系统的搭建、维护和优化,保障系统稳定性与安全性。 5. 协助开发团队解决代码管理、分支合并、冲突解决等相关问题,提升团队协作效率。 6. 编写和维护相关技术文档,制定运维和开发流程规范,协助团队成员培训与技术支持。 7. 关注并评估业界新技术,推动运维体系的持续改进和创新。
更新于 2025-08-18广州
社招3年以上技术-SRE
1、负责公有云 IAAS资源运维、k8s维护、应用发布、站点建设等日常运维支持工作 2、参与值班和应急响应,快速解决生产环境中的突发故障,保证产品7*24小时业务连续性 3、通过监控治理、架构设计、容灾演练、性能优化等手段,持续提升站点可用性 4、参与平台的设计和开发,将日常运维工作自动化,提升运维质量和效率
更新于 2025-05-06杭州