老虎国际SRE工程师

社招全职5年以上运维2024-11-20地点：北京状态：招聘

扫码手机上打开

任职要求

1、至少5年以上互联网公司运维相关经验;
2、熟悉JVM虚拟机的内存机制、GC机制，能进行JAVA进程异常的故障定位及排查;
3、熟悉Nginx,Zookeeper, Kafka,RocketMQ等常用WEB中间件的维护与使用;
4、有丰富的系统故障排查和解决经验，…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责公司业务系统运维工作，提升业务稳定性和工程效率，与业务方保持高效沟通，建立良好合作关系；
2、参与业务服务端架构的高可用设计和性能优化，保证高效、可靠的业务迭代;
3、负责线上重大问题排查，紧急事故处理，后续事故分析与优化;
4、负责应用故障演练、应急预案、SOP手册编写工作，确保故障时业务能快速恢复;
5、负责应用高可用建议及管理，包括限流、降级，容错、容灾，同城多活，确保应用质量;
6、建立SLA评估标准，计算故障对SLA影响，并对SLA后续改进措施进行跟进。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

JVM+

GC+

Java+

Nginx+

ZooKeeper+

Kafka+

RocketMQ+

还有更多 •••

登录查看完整学习资料

相关职位

SRE工程师（J84044）

社招3年以上ACG

-负责百度云CDN&边缘计算平台的资源交付、容量管理及大规模分布式集群的架构设计工作，构建行业领先的资源平台 -负责百度云CDN&边缘计算自动化运维平台发布实践、实现CI/CD全流程管控，打造智能化运维平台提升效率及产品服务稳定性 -负责百度云CDN&边缘计算业务运营、指标体系建设 -负责百度云CDN&边缘计算大客户解决方案落地及质量调优工作

更新于 2025-03-31北京

阿里云智能-大数据研发专家-Maxcompute

社招8年以上技术类-开发

1、承担MaxCompute管控系统架构师角色，负责产品技术架构演进方向 2、面向全球不同客户设计合理的产品方案，梳理存储、计算、售卖、控制台、运维体系架构，确定技术方案选型 3、承担MaxCompute管控系统设计、研发、测试、发布与运维 4、与MaxCompute各研发团队+SRE中台团队+阿里云售卖平台配合，共同推进技术项目按要求落地

更新于 2025-04-02杭州

高级运维工程师（SRE）

社招其他

1、负责支撑网易集团旗下云音乐、Loft、支付等互联网产品的运维工作（涵盖操作系统运维、系统运维、容器运维等多个层面的工作），帮助业务持续提升产品稳定性； 2、负责相关运维工具和平台研发，通过工具和平台将运维能力赋能给外部其他团队，帮助其他团队提升效率； 3、关注业界前沿技术动态，通过新的运维技术和方法解决线上问题，提升团队运维质量； 4、持续优化运维操作和流程，保障海量用户的互联网产品稳定运行。

更新于 2025-04-14杭州

SRE运维开发工程师（J73254）

社招3年以上ACG

-负责金融联合建模产品各类在线服务和自动化工具开发，保障服务可靠、稳定、高效运行，保障服务稳定性和数据质量，保障产品SLA -基于百度已有基础设施设计金融联合建模相关在线服务稳定性解决方案，包括预防、止损、降级、容量管理、弹性部署、故障分析、流量分配、性能调优等方案 -参与金融联合建模产品各类在线服务和各类模型产品部署运行架构设计，主导服务可靠性相关自动化系统的实现，满足严格的质量与效率要求 -利用百度已有基础设施和开源技术设计和实施产品监控系统、容灾策略和灾难恢复预案，响应和处理生产环境中的紧急事件，最小化服务中断 -关注业界前沿技术动态，负责大规模机器学习模型在线预测系统优化，演进和新接入技术探索和应用

更新于 2024-10-29北京