京东大数据运维开发岗
任职要求
1. 教育背景 学历要求:本科及以上学历,计算机科学、软件工程或相关专业; 2. 工作经验 工作经验:5-10年大数据平台维护经验,具备大规模数据平台运维经验; 3. 能力要求: 技术能力:深入理解Linux系统,熟悉运维体系结构,精通容量规划、架构设计、性能优化;具备一定的开发能力,精通至少一种脚本语言(如Shell、Perl、Python等),熟悉Java/C/C++等开发语言,具备良好的系统性能优化及故障排除能力;熟悉Hadoop、HBase、Hive、Spark、Presto等大数据技术栈,具备管理、配置、运维经验;熟悉分布式系统设计范式,有大规模系统设计和工程实现经验者优先;熟悉SaltStack/An…
工作职责
1. 负责大数据基础架构平台(如Hadoop、YARN、Hive、Spark、Presto等)及各类中间件的运维工作,确保数据平台服务的稳定性与高可用性; 2. 承担大数据环境的组件升级、资源规划、服务监控等持续运营与规划任务,优化系统性能,提升运维效率; 3. 参与自动化运维系统及平台的建设,推动运维流程的自动化与智能化,减少人工干预,提高运维质量; 4. 解决平台技术难题,对突发问题快速响应并解决,确保业务连续性和数据安全; 5. 优化部门运维流程,提升整体运维效率,确保团队能够高效协作,共同达成业务目标。
1.负责公司网络、系统和大数据运维、管理及优化工作,包括处理日常运维需求、运维变更、资源管理、服务管理、问题排查等; 2.负责及时响应和处理故障,积累经验缩短故障处理时长,并通过深度复盘和改进避免故障重复发生; 3.收集和分析网络和业务系统的运行数据,找到系统风险点,推进稳定性改进项目; 4.承接内部运维相关项目立项及实施工作,协助一线工程师解决后台技术问题; 5.负责运维工具开发,提升日常工作效率。
1、负责开发IT统一运维平台、监控报警体系和Devops自动化平台的构建、设计、开发、部署、升级与维护,包括不限于监控告警系统、日志系统、容量管理、CMDB资源管理、配置中心、调度系统、流程系统、IM服务平台等系统开发 2、运维自动化工具开发:基于SRE运维工作,理解需求背景和业务发展,开发自动化工具和平台提升效率; 3、SRE高可用保障:参与故障应急、稳定性优化等工作,并设计系统助力运维能力提升; 4、负责IT成本管理,稳定性建设,日志分析、挖掘问题隐患、配合制作相关预案,项目跟进 5、负责日常应用运维oncall,SRE,包括配置、优化、备份、故障处理等工作
1、负责开发IT统一运维平台、监控报警体系和Devops自动化平台的构建、设计、开发、部署、升级与维护,包括不限于监控告警系统、日志系统、容量管理、CMDB资源管理、配置中心、调度系统、流程系统、IM服务平台等系统开发 2、运维自动化工具开发:基于SRE运维工作,理解需求背景和业务发展,开发自动化工具和平台提升效率; 3、SRE高可用保障:参与故障应急、稳定性优化等工作,并设计系统助力运维能力提升; 4、负责IT成本管理,稳定性建设,日志分析、挖掘问题隐患、配合制作相关预案,项目跟进 5、负责日常应用运维oncall,SRE,包括配置、优化、备份、故障处理等工作