字节跳动SRE成本&资源管理专家-基础架构
任职要求
1、本科以上学历,对以下一个或者几个领域有深入的理解:成本优化、资源管理、基础架构容量规划; 2、扎实的计算机软件基础知识;了解Linux操作系统、存储、网络IO等相关原理; 3、具有相关计算/分布式/大…
工作职责
1、学习字节跳动相关产品业务,如抖音,飞书,西瓜视频等各类业务; 2、学习字节跳动应用、系统、基础设施等各层技术的调用关系; 3、负责设计、落地的业务、系统组件的成本和资源管理解决方案,包括但不限于资源售卖率&利用率监控和管理、基础设施资源&业务容量规划、需求和预算管理、硬件选型、重大活动资源管理等; 4、深入支撑业务全局性的成本和资源类问题,包括指标体系建设、协同机制和流程建设和整体业务的保障,并持续优化该体系的效率; 5、主导并推进成本和资源管理解决方案落地到产品工具中,通过产品工具和数据化驱动降低成本,实现高效自动化的平台化能力。
1、学习字节跳动相关产品业务,如抖音,飞书,西瓜视频等各类业务; 2、学习字节跳动应用、系统、基础设施等各层技术的调用关系; 3、负责设计、落地的业务、系统组件的成本和资源管理解决方案,包括但不限于资源售卖率&利用率监控和管理、基础设施资源&业务容量规划、需求和预算管理、硬件选型、重大活动资源管理等; 4、深入支撑业务全局性的成本和资源类问题,包括指标体系建设、协同机制和流程建设和整体业务的保障,并持续优化该体系的效率; 5、主导并推进成本和资源管理解决方案落地到产品工具中,通过产品工具和数据化驱动降低成本,实现高效自动化的平台化能力。
1、通过自动化和工程化手段来解决抖音服务端资源交付和管理问题,制定资源容量和管理计划,为不断增长的业务提供坚实的基础设施支持; 2、建设资源容量相关数据体系,由数据驱动制定资源容量和管理计划,持续优化供需,降低成本; 3、预测未来负载和资源需求,对历史和现有的系统负载、用户行为和数据趋势进行分析,并做出相应的资源规划和调整,避免资源短缺和超量配置导致的问题; 4、优化资源效率,设计、实现、部署自动化工具和系统来管理、监控和调整资源使用,实现资源自动扩缩,以及通过系统配置、优化算法、采用更高效的技术等方式,减少资源浪费,降低成本,提升性能; 5、支撑抖音服务端大型活动或项目的资源方案的落地,通过项目化运作保障业务发展并推动系统化能力的沉淀和建设; 6、建立和维护与其他团队的有效沟通和协作,例如开发、产品和运营团队,以实现资源的全生命周期管理。
1、保障在线业务的核心链路正常运行,同时关注系统成本与稳定性; 2、参与业务和基础架构的日常容灾演练,需要设计演练方案、执行剧本,并组织业务同学一起完成演练; 3、通过监控系统组件可用性、性能指标提升系统可见性,帮助系统开发以及团队快速定位故障; 4、推动提升服务的可靠性、可扩展性以及成本、性能优化,保障系统SLA; 5、基于业务使用场景,深入优化提供最佳服务治理实践,包含不局限于关键链路性能瓶颈分析、业务问题定位排障、推进系统高可用架构改造升级等。