logo of bytedance

字节跳动SRE高级工程师/架构师-基础架构

社招全职2年以上A4028地点:北京状态:招聘

任职要求


1、本科以上学历,计算机相关专业,并有两年以上SRE相关领域工作经验;
2、扎实的计算机软件基础知识;了解Linux操作系统、存储、网络IO等相关原理;
3、熟悉一种或多种编程语言,例如Go/Python/Java/Shell等;
4、具备系统化解决问题的能力或工程化研发能力,良…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、Site Reliability Engineer (SRE) 结合了软件和系统工程,致力于打造高扩展、高可用的分布式系统;
2、保障大数据/计算/云原生/分布式存储等多个核心系统的可靠性与正常运行,同时关注系统成本与稳定性;
3、为大型系统构建自动化运营解决方案;与系统开发团队合作,从系统设计到上线的整个生命周期内保障系统可靠性;
4、通过监控系统组件可用性、性能指标提升系统可见性,帮助系统开发以及团队快速定位故障;
5、推动提升服务的可靠性、可扩展性以及成本、性能优化,保障系统SLA;参与设计、实现能够保障线上大规模集群快速迭代的自动化平台;
6、基于业务使用场景,深入优化提供最佳服务治理实践,包含不局限于关键链路性能瓶颈分析、业务问题定位排障、推进系统高可用架构改造升级等。
包括英文材料
学历+
Linux+
Go+
Python+
Java+
Bash+
大数据+
Nginx+
还有更多 •••
相关职位

logo of alibaba
社招3年以上技术类-开发

1、负责核心业务系统的Java开发工作,确保系统的稳定性和高性能。 2、参与需求分析,设计并实现高效、可扩展的代码结构,优化系统性能。 3、与团队协作,解决复杂的技术问题,推动项目进度。 4、对现有系统进行维护和优化,提升系统质量和用户体验。 5、参与技术分享,提升团队技术水平,推动技术栈的持续升级。

更新于 2025-04-18杭州
logo of aliyun
社招2年以上诚云科技

1、云产品稳定性保障,风险巡检 客户云产品稳定性、体验相关事项治理,产品风险巡检,故障的应急跟进与处理 2、客户技术专项处置与支持 复杂、疑难问题/技术方案/活动护航保障/产研共建专项主导与管理工作 3、排查问题,管控体验 高效排查解决产品技术售后问题,在服务过程中关注客户体验提升、有效管控客情 4、专精客户行业,技术沉淀 提炼客户行业技术服务方案,沉淀内部技术文档,持续提高公共云/混合云各行业最佳实践能力

更新于 2025-10-10西安|北京|杭州
logo of netease
社招网易游戏(互娱)

运维研发工程师(SRE)是指用软件工程的方法来管理系统、解决问题并实现运维自动化,以减少琐事,提高服务的可用性。 包括但不限于如下工作内容: 1. 负责网易互娱业务的运维工作,如蛋仔派对、第五人格、UU加速器、一梦江湖、王牌竞速等在线业务,以及公司内部在研项目。; 2. 根据不同游戏的服务架构、性能需求以及业务情况,为游戏服务端设计选用基础运行环境(包括服务器、虚拟化、云服务、网络、数据库等),为游戏提供可控成本下高质、高效的运维服务; 3. 建立与监控各类运维指标,定制数据分析标准; 4. 联合产品部门,根据游戏和基础环境情况及时发现问题、优化技术架构,提升用户体验; 5. 参与前沿开源软件、虚拟化、数据库、WEB服务的深入研究,结合业务落地技术方案。

更新于 2025-05-21杭州
logo of tencent
社招5年以上腾讯云技术

1.负责腾讯云大数据基础运维和客户问题解决,基于腾讯云提供的EMR、Elasticsearch、TCHouse产品,解决客户在产品使用过程中遇到的问题,为客户业务提供最佳服务体验; 2.负责报障大数据产品服务稳定性,包括全局数智化监控、服务架构容灾、容量管理等基础运维能力建设,保障大数据服务SLA; 3.负责运维标准流程规范制定,建设大数据产品运维标准、大数据产品规范化变更流程和大数据组件可观测性标准等; 4.参与智能化运维AIOps,对标互联网SRE业界优秀经验,基于自研运维平台,实现智能化运维,提升运维效率。

更新于 2025-08-05上海