字节跳动SRE稳定性高级研发工程师-互娱抖音服务架构
社招全职A144910地点:北京状态:招聘
任职要求
1、本科及以上学历,具备互联网业务研发/测试/运维实战经验; 2、主导或深度参与过稳定性架构治理、高可用保障、红蓝攻防等稳定性领域的建设工作,至少在一个领域有深入的理解; 3、优秀的逻辑思维和问题分析能力,良好的沟通表达、团队协作,责任心和执行力强,在擅长领域有较好的技术视野,有创新突破的自驱力; 4、有机器学习及运维开发经验者优先。
工作职责
1、负责互娱研发质量线稳定性治理工作,主导以下任一领域方案与能力建设,支撑业务达成目标; 2、负责性能容量治理,对业务建立常态化容量保障机制,持续沉淀产品化方案并主导落地; 3、负责稳定性蓝军工作,构建风险挖掘、演练、评估体系,产出攻防相关工具平台产品化方案; 4、负责AIOps方案设计与落地,利用AI技术提升链路依赖、容量、监控等方向治理的效果和效率。
包括英文材料
学历+
高可用+
https://redis.io/blog/high-availability-architecture/
A high available architecture is when there are a number of different components, modules, or services that work together to maintain optimal performance, irrespective of peak-time loads.
https://www.ibm.com/think/topics/high-availability
High availability (HA) is a term that refers to a system’s ability to be accessible and reliable close to 100% of the time.
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
相关职位
社招3年以上
1. 负责犀游社项目内容社区、会员体系、游戏工具等核心域开发; 2. 负责服务架构链路设计、高性能高可用方案设计与落地,推动整体架构持续演进和维护系统稳定; 3. 需具有良好的业务敏感度与协作推进能力,参与/负责跨团队的专项/战役攻坚;
更新于 2025-08-22
社招6年以上
1.负责在研SLG项目服务端架构设计与核心逻辑开发,支持高并发和大规模玩家在线需求。 2.构建高效、稳定的大世界服务端框架,支持高并发和大规模玩家在线需求。 3.负责性能调优,优化服务器资源利用率,保障高负载下的稳定性和流畅性。 4.处理线上重大事故,快速定位问题并修复,确保服务器高可用性。 5.参与版本迭代,持续优化服务端功能及性能,支持游戏长线运营。
更新于 2025-09-22
社招A205757
1、负责服务端质量工程效能的架构设计、开发与维护,支撑业务质量&稳定性、研发效能提升; 2、调研新技术,参与技术难题的攻关,沉淀技术能力和行业经验,与平台一起成长发展; 3、对产品提出改进建议以建立极致的用户感受,对项目提出改进建议以提高项目整体效率。
更新于 2024-09-25