logo of netease

网易高级/资深服务器运维工程师

社招全职3-5年网易职能地点:杭州状态:招聘

任职要求


1、本科及以上学历,对数据敏感,有较好的数据分析能力; 
2、具备3年以上工作经验,硬件运维、系统运维等优先;
3、具备ShellPython和Ansible编程能力,能熟练使用linux命令开展工作; 
4、熟悉服务器、HDD、SSD、RAID卡、网卡等部件的…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责服务器系统安装和问题排障; 
2、负责分析解决服务器运行中的各类硬件问题; 
3、负责服务器状态监控和数据分析,及时发现并解决潜在问题; 
4、负责服务器硬件的调研,测试,输出技术报告,持续跟进技术发展趋势; 
5、协助服务器带外(Out-of-band)管理,开发自动化运维工具; 
6、编写和维护知识库文档,跟踪、推进问题修复进展。
包括英文材料
学历+
数据分析+
Bash+
Python+
还有更多 •••
相关职位

logo of netease
社招3年以上网易职能

1、负责支撑整个部门的产品运维工作,包括Linux操作系统及基础服务如Nginx、Kvm、DNS、DHCP、ES等日常管理和维护; 2、负责排查处理linux下的各类故障告警,进行相关系统调优, 持续完善监控告警体系; 3、参与自动化运维工具和平台开发,提升自动化程度,减少人为操作风险;通过工具和平台将运维能力赋能给外部其他团队,提高整体效率; 4、负责业务产品的服务器系统层架构设计,实施和维护高可用性、高性能系统架构,确保服务稳定性,将可靠性作为系统设计的核心目标 5、与开发、网络等其他团队紧密协作,提供所需系统层面技术支持和解决方案; 6、持续优化运维操作和流程,建立和维护完善的技术文档,构建团队知识库,促进经验共享和知识传承; 7、关注业界前沿技术动态,通过新的运维技术和方法解决线上问题,提升团队运维质量。

更新于 2025-05-08杭州
logo of ctrip
社招3年以上技术团队系统安全

1、参与公司基础架构的安全建设,完善安全纵深防御体系,以及相关安全项目管理和推进; 2、应对传统生产环境、公有云、私有云、混合云等复杂网络环境,设计和推进合理的安全防护方案; 3、为软件、系统安全基线、供应链、边界风险、运维部署等基础设施安全; 4、负责服务器及核心系统等系统安全策略的制定、实施、安全审计、持续改进; 5、跟进业界安全能力的前沿趋势,调优公司相应的防御水位。

更新于 2025-02-10上海
logo of bilibili
社招6年以上游戏类

1.独立完成高度复杂游戏业务需求,兼顾安全,性能性能容灾能力 2.游戏服务器的核心系统的设计与开发 3.系统核心模块的性能调优 4.深入优化MongoDB/Redis集群,根据需求定制高性能数据存储与缓存策略,支持高并发场景 5.团队赋能,指导初高级工程师,提升团队整体技术效率与代码质量

更新于 2025-06-17上海
logo of thead
社招5年以上技术-芯片

我们正在寻找一位兼具后端开发功底与系统级视野的优秀工程师,加入我们致力于构建高性能软件研发基础设施的技术团队。 在这里,你将深度参与企业级编译系统、构建流水线与自动化发布平台的建设,专注于提升大规模项目的构建效率、稳定性和可复现性。如果你热爱底层技术、关注编译性能与构建可靠性,并希望在复杂工程场景中打造高效的研发基座,这正是为你准备的舞台! 你将负责: 1. 设计与维护高性能 CI/CD 构建平台 基于 Jenkins、GitLab CI 或自研系统,搭建支持多语言(C/C++/Go/Python)的自动化构建流水线;优化构建缓存、依赖管理与并行编译策略,显著缩短构建时间。 2. 构建和优化编译环境与工具链 管理和维护基于 GCC、Clang/LLVM的标准化编译环境,支持不同版本共存与按需切换;定制编译参数、警告规则与静态分析流程,提升代码质量与一致性。 3. 推动构建可重复性与确定性编译(Reproducible Builds) 实现构建过程的环境隔离(Docker/Singularity)、依赖锁定与输出校验,确保“一次构建,处处一致”,满足安全审计与发布合规要求。 4. 性能分析与构建加速优化 使用 time, strace, perf, Bear, compile_commands.json 等工具分析编译瓶颈;集成分布式编译方案(如 Incredibuild、distcc、sccache)或增量构建机制,提升大型项目编译速度。 5. 构建全链路可观测性系统 搭建覆盖构建耗时、失败率、资源消耗的监控体系,集成 Prometheus + Grafana;实现构建日志聚合、错误自动归因与趋势预警。 6. 推进基础设施即代码(IaC)与平台化能力建设 使用 Terraform/Ansible 自动化部署构建节点与编译集群;通过 API 和 Web 控制台提供自助式构建服务,提升研发效率。

更新于 2025-10-28上海