灵犀互娱监控平台开发工程师
任职要求
1、热爱游戏,热爱技术,对底层平台和监控方向有兴趣,对技术产品研发充满热情; 2、熟练掌握一种编程语言(Golang/C/C++等均可),有项目实践经验; 3、深入理解数据结构、算法、操作系统、网络等计算机科学基础; 4、了解数据库或缓存的基础概念,有 MySQL、Redis 或其他数据库使用经验; 5、对后台研发、分布式系统、云原生和监控方向有兴趣,愿意在工作中持续学习新技术; 6、具备良好的学习能力和自驱力,沟通顺畅,有团队协作意识和责任心。 加…
工作职责
灵犀互娱监控平台团队负责游戏前后端的稳定性和性能保障,致力于打造业界领先的一站式游戏可观测性解决方案。我们欢迎对监控与游戏技术感兴趣的你加入,在真实的大规模游戏场景中快速成长。 你将负责: 1、参与设计、开发、迭代游戏可观测性平台,为游戏项目提供“一站式数据视角”,帮助团队更快发现问题、更稳上线游戏; 2、动手解决真实线上场景中的稳定性与性能问题,不断打磨监控平台的能力边界,探索更高效的监控与分析方式; 3、持续学习和尝试业界前沿的可观测性技术与实践,为平台引入更先进的监控方案,让平台始终保持活力; 4、支持可观测性在游戏项目中的落地,与游戏开发团队紧密合作,用数据守护游戏的流畅运行和玩家体验。
1、负责灵犀互娱可观测性相关产品的设计、开发、维护工作; 2、研究可观测性相关技术和领域困难问题,形成解决方案,推动公司可观测性技术发展; 3、参与具体游戏业务的可观测性建设,协助保障项目稳定性和性能质量。
1、负责开发IT统一运维平台、监控报警体系和Devops自动化平台的构建、设计、开发、部署、升级与维护,包括不限于监控告警系统、日志系统、容量管理、CMDB资源管理、配置中心、调度系统、流程系统、IM服务平台等系统开发 2、运维自动化工具开发:基于SRE运维工作,理解需求背景和业务发展,开发自动化工具和平台提升效率; 3、SRE高可用保障:参与故障应急、稳定性优化等工作,并设计系统助力运维能力提升; 4、负责IT成本管理,稳定性建设,日志分析、挖掘问题隐患、配合制作相关预案,项目跟进 5、负责日常应用运维oncall,SRE,包括配置、优化、备份、故障处理等工作
1、负责开发IT统一运维平台、监控报警体系和Devops自动化平台的构建、设计、开发、部署、升级与维护,包括不限于监控告警系统、日志系统、容量管理、CMDB资源管理、配置中心、调度系统、流程系统、IM服务平台等系统开发 2、运维自动化工具开发:基于SRE运维工作,理解需求背景和业务发展,开发自动化工具和平台提升效率; 3、SRE高可用保障:参与故障应急、稳定性优化等工作,并设计系统助力运维能力提升; 4、负责IT成本管理,稳定性建设,日志分析、挖掘问题隐患、配合制作相关预案,项目跟进 5、负责日常应用运维oncall,SRE,包括配置、优化、备份、故障处理等工作
团队介绍:字节跳动产品研发和工程架构端智能团队,负责端智能基建和业务算法落地。团队产品在字节跳动核心应用的推荐、广告、直播、电商、消息、社交等场景中应用。在这里,你可以深入钻研机器学习算法,通过云端协同推荐、横向联邦学习等前沿技术,结合对产品的理解和思考,优化核心应用、核心场景的商业效率;还可以探索 SLM、VLM 等新技术,开拓未来产品方向。 1、负责端智能平台服务端开发,包括架构设计、功能研发、性能优化、技术难题攻关等; 2、构建端智能特征管理和监控平台,满足云端特征的复用、淘汰,更新等需求; 3、追求极致,探索机器学习平台前沿方向,构建业内领先的端智能平台服务。