
同程旅行运维开发工程师(网络运维方向)
社招全职5年以上地点:苏州 | 北京状态:招聘
任职要求
1、全日制本科以上学历,5年以上开发工作经验,3年以上网络运维开发相关经验,优秀工作经历者学历要求可放宽; 2、熟练掌握IP-CLOS,SRv6,EVPN,BGP,OSPF,MLAG原理和应用,并应用于网络架构设计,工程交付和持续优化工作; 3、熟练掌握网络SLA99.99%度量和交付标准,并可识别当前网络风险Top10,并制定落地改造方案; 4、熟练掌握监控系统(如夜莺,Prometheus)部署和应用于网络运维,将网络核心运营数据指标化和可视化;…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责网络架构的日常运维、架构设计、应急响应和问题处理。网络系统内部和外部突发事件处理,线路和设备疑难问题及风险根因分析和解决,保障每天网络稳定运行SLA99.99%; 2、负责网络系统解决方案设计和交付,带领或者推动其他专业一起完成重点项目交付; 3、主导网络自动化运维体系建设,负责网络自动化运维平台的方案的设计、研发、优化、重构和运维工作; 4、负责网络基础信息、故障率、可用性、容量性能、业务按量计费、成本等数据的运营和分析,提升网络稳定性和运维效率; 5、负责网络运维自动化知识库建设和人才培养,为团队提供标准、流程规范和指导文档。
包括英文材料
学历+
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
Prometheus+
https://grafana.com/docs/grafana/latest/getting-started/get-started-grafana-prometheus/
Prometheus is an open source monitoring system for which Grafana provides out-of-the-box support.
https://prometheus.io/docs/tutorials/getting_started/
Prometheus is a system monitoring and alerting system.
分布式系统+
https://www.distributedsystemscourse.com/
The home page of a free online class in distributed systems.
https://www.youtube.com/watch?v=7VbL89mKK3M&list=PLOE1GTZ5ouRPbpTnrZ3Wqjamfwn_Q5Y9A
缓存+
https://hackernoon.com/the-system-design-cheat-sheet-cache
The cache is a layer that stores a subset of data, typically the most frequently accessed or essential information, in a location quicker to access than its primary storage location.
https://www.youtube.com/watch?v=bP4BeUjNkXc
Caching strategies, Distributed Caching, Eviction Policies, Write-Through Cache and Least Recently Used (LRU) cache are all important terms when it comes to designing an efficient system with a caching layer.
https://www.youtube.com/watch?v=dGAgxozNWFE
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
还有更多 •••
相关职位
社招4年以上诚云科技
1、客户现场专项技术负责人,如网络专项、数据库专项; 2、平台稳定性重大变更方案制定与实施,如性能/存储优化、底座改造等; 3、现场故障应急执行,协助原厂尽快恢复平台运行; 4、关键时刻现场保障,如客户平台隐患深度排查与治理; 5、复杂问题原因定位及解决;
更新于 2025-11-24北京|沈阳
社招5-10年网易云音乐
参与网易云音乐内部以及网易集团OLAP平台建设和落地工作,工作包含但不限于以下几点: 1、负责OLAP引擎 Doris 服务的研发、维护和优化工作; 2、负责OLAP周围生态体系建设工作,如实时离线场景下数据的导入导出、监控告警体系等; 3、负责OLAP相关业务场景落地,根据不同业务场景提供匹配到解决方案。
更新于 2025-08-19杭州
社招3年以上ACG
-岗位核心目标:主导设计、构建并优化企业级私有化交付运维平台架构,实现资源统一纳管、自动化部署、可观测性及全生命周期管理,提升客户私有化交付效率与稳定性 -关键职责如下: - 架构设计与开发 -设计高可用、可扩展的私有化交付平台架构 -开发核心模块:资源编排引擎、自动化部署框架、自动化装机引擎 -构建多集群管理能力,实现跨地域私有化项目统一管控 -技术栈整合:整合IaC工具链、容器编排、工作流编排 -交付体验优化:开发可视化交付控制台,提供部署、变更、运维一体化操作界面 -实现交付流程可观测性:部署进度追踪、实时日志、资源拓扑自动生成 -工程效能提升: -建设 CI/CD流水线,支持平台自身的持续集成与灰度发布 -探索基于大模型的智能部署运维架构:自动化任务编排、根因分析、排错指引 -技术领导:主导技术选型及架构评审,制定开发规范
更新于 2025-07-15北京