logo of jd

京东SRE

社招全职5年以上运维工程师岗地点:北京状态:招聘

任职要求


1.本科及以上学历,计算机科学、信息技术或相关专业背景;
2.5年以上系统运维、性能优化、故障排查等相关经验;
3.熟练使用自动化运维工具,具备GolangPythonShell脚本编程经验;
4.深入了解云计算、容器化技术(如DockerKubernetes);
5.具备强大的故障排除和问题解决能力,能够在高压环境下迅速应对;
6.有大型分布式系统的设计和维护经验者优先。


符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。

工作职责


1.负责保障公司系统、应用和服务的高可用性、可靠性和性能,设计、实施和维护监控系统,及时发现并解决潜在问题;
2.快速响应和解决生产环境中的故障,确保系统正常运行;
3.开发和维护自动化工具,提高系统部署、配置和监控的效率;
4.分析系统资源使用情况,进行容量规划,确保系统能够满足业务增长需求。
包括英文材料
学历+
Go+
Python+
Bash+
脚本+
Docker+
Kubernetes+
分布式系统+
相关职位

logo of baidu
社招3年以上ACG

-负责百度云CDN&边缘计算平台的资源交付、容量管理及大规模分布式集群的架构设计工作,构建行业领先的资源平台 -负责百度云CDN&边缘计算自动化运维平台发布实践、实现CI/CD全流程管控,打造智能化运维平台提升效率及产品服务稳定性 -负责百度云CDN&边缘计算业务运营、指标体系建设 -负责百度云CDN&边缘计算大客户解决方案落地及质量调优工作

更新于 2025-03-31
logo of baidu
社招3年以上ACG

-负责金融联合建模产品各类在线服务和自动化工具开发,保障服务可靠、稳定、高效运行,保障服务稳定性和数据质量,保障产品SLA -基于百度已有基础设施设计金融联合建模相关在线服务稳定性解决方案,包括预防、止损、降级、容量管理、弹性部署、故障分析、流量分配、性能调优等方案 -参与金融联合建模产品各类在线服务和各类模型产品部署运行架构设计,主导服务可靠性相关自动化系统的实现,满足严格的质量与效率要求 -利用百度已有基础设施和开源技术设计和实施产品监控系统、容灾策略和灾难恢复预案,响应和处理生产环境中的紧急事件,最小化服务中断 -关注业界前沿技术动态,负责大规模机器学习模型在线预测系统优化,演进和新接入技术探索和应用

更新于 2024-10-29
logo of bytedance
社招3年以上A91599A

1、负责Sdwan网络的日常运维、监控和故障排除,及时响应并解决网络故障和性能问题; 2、构建和维护Sdwan网络的监控和告警系统,实现对网络状态的全面监控和预警; 3、开发和维护自动化运维工具和脚本,提高运维效率,减少人为错误,并负责编写和维护Sdwan网络相关的文档和知识库; 4、参与容量规划和性能测试,确保Sd-wan网络能够满足业务需求。

更新于 2025-01-08
logo of baidu
社招3年以上ACG

-负责百度云CDN&边缘计算平台的资源交付、容量管理及大规模分布式集群的架构设计工作,构建行业领先的资源平台 -负责百度云CDN&边缘计算自动化运维平台发布实践、实现CI/CD全流程管控,打造智能化运维平台提升效率及产品服务稳定性 -负责百度云CDN&边缘计算业务运营、指标体系建设 -负责百度云CDN&边缘计算大客户解决方案落地及质量调优工作

更新于 2025-06-12