百度高级SRE工程师（J85001）

社招全职5年以上TPG2025-05-08地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

-本科或本科以上学历，计算机相关专业，五年以上大型系统运维从业经验
-深入理解Linux系统，常用服务器组件、容器化及编排技术、运维体系结构
-精通服务高可用设计，容量规划、架构设计、性能优化
-具有丰富的系统管理、故障处理与性能调优经验；具…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

-负责业务稳定性建设和可用性保障
-负责分布式平台性能和架构优化
-负责设计和实现运维自动化相关系统或工具
-负责业务架构向容器化迁移，提升业务变更和故障自愈能力
-研究与产品发展匹配的运维技术，不断提升资源和交付效率

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Linux+

高可用+

系统设计+

还有更多 •••

登录查看完整学习资料

相关职位

高级SRE工程师

社招3-5年网易游戏（互娱）

1. 负责GitLab、SVN、Perforce等版本管理工具的日常维护，参与相关工具的二次开发和定制化功能开发。 2. 负责持续集成（CI）、持续交付（CD）流水线的设计、优化和自动化管理，推动DevOps最佳实践落地。 3. 参与并推动公司各类开发、测试工具链的集成与自动化流程建设，提升研发效率和交付质量。 4. 参与应用日志采集、监控与报警系统的搭建、维护和优化，保障系统稳定性与安全性。 5. 协助开发团队解决代码管理、分支合并、冲突解决等相关问题，提升团队协作效率。 6. 编写和维护相关技术文档，制定运维和开发流程规范，协助团队成员培训与技术支持。 7. 关注并评估业界新技术，推动运维体系的持续改进和创新。

更新于 2025-08-18广州

高级SRE工程师

社招5年以上核心本地商业-基

系统可靠性设计与实施：设计和实施可靠、可扩展和高性能的系统架构，确保全球用户的无缝体验。故障排除与应急响应：主导重大故障的指挥，组织各方有序处理，制定并实施应急预案，确保快速响应和问题解决。跨团队协作：与开发、产品和运营团队紧密合作，持续提升交付效率和质量。容量规划：进行容量规划和管理，优化资源利用率，降低成本。国际化部署方案支持：规划和实施全球化的部署方案，确保各地区的系统一致性和高效运行。针对不同地域的网络环境和法规要求，优化系统架构和数据传输策略。

更新于 2025-06-10北京

高级SRE工程师

社招2-8年SOFTWARE

1.负责公司MySQL、Redis、MongoDB、PostgreSQL等数据库运维工作，保证系统7*24小时稳定运行 2.负责公司业务线数据库稳定高效运行，协助业务解决潜在的数据库风险，保障SLA达成 3.数据库架构设计：负责公司数据库高可用（HA）及容灾、读写分离、分库分表、分布式数据库等架构设计，确保系统稳定性和可扩展性 4.数据安全：实施数据库权限管理、审计、加密、防注入、备份恢复等安全策略，确保数据安全合规 5.性能优化：监控并优化SQL查询、索引、存储引擎配置，解决慢查询、死锁、高负载等问题，提升数据库响应速度 6.自动化运维：运用DevOPS/AIOPS技术提升运维效率，不断提升数据库运维工程化水平 7.新技术研究：跟踪云数据领域关键核心技术及行业动态，推动数据库架构升级

更新于 2025-07-28成都

高级 SRE工程师-AI平台

社招智能与信息技术

1. 负责理想汽车AI平台RDMA网络下大规模GPU集群和并行高速存储的运维工作，为业务平台的可用性负责 2. 调查解决大规模GPU集群管理和大规模AI训练情况下遇到的各种系统/稳定性问题，打造自动化，稳定，易于运维的高速网络和超算集群 3. 深入理解业务,推动AI平台在K8S多集群架构、监控平台、日志等方向的云原生架构演进并落地解决方案 4. 持续建设AI平台运维体系、在稳定性建设、故障定位、资源运营等方向，推动运维工作自动化、工程化

北京