字节跳动基础设施系统架构师
任职要求
1、5年以上云计算服务器相关端到端的架构设计经验,在IDC建设、服务器硬件设计/选型/落地等方面有较深的技术积累; 2、深入理解计算机体系结构,精通CPU、内存、SSD、网卡等服务器部件中的一个或者多个的架构设计和原理细节; 3、熟悉数据中心基础设施、集群网络、部署及运营维护 ,能够协同开展技术规划、推进实施; 4、具有跨团队项目的主导或推动的成功经验;具备良好的沟通能力和领导力,能够带领项目组解决复杂的技术问题,推动项目的成功实施; 5、熟悉虚拟化、DPU、内核、操作系统、物理网络、分布式存储等任一技术领域者优先。
工作职责
1、主导火山引擎IaaS方向的机房规划、服务器规划、集群组网等IDC基础设施的设计与规划,确保技术规划的系统性和领先性; 2、主导IaaS CPU方向的服务器技术选型,参与制定服务器开发和架构演进的路标,确保满足业务需求和技术先进性,对产品架构的领先性、可实施性负责; 3、研究云计算行业基础设施方面的最新技术,和硬件研发、网络、存储、内核、操作系统等团队紧密配合,实现硬件方案创新,提升性能、降低成本,为基础设施的TCO、性能、高可用、可运维性等方面的竞争力负责。
1、主导火山引擎IaaS方向的机房规划、服务器规划、集群组网等IDC基础设施的设计与规划,确保技术规划的系统性和领先性; 2、主导IaaS CPU方向的服务器技术选型,参与制定服务器开发和架构演进的路标,确保满足业务需求和技术先进性,对产品架构的领先性、可实施性负责; 3、研究云计算行业基础设施方面的最新技术,和硬件研发、网络、存储、内核、操作系统等团队紧密配合,实现硬件方案创新,提升性能、降低成本,为基础设施的TCO、性能、高可用、可运维性等方面的竞争力负责。
工作内容:负责对接腾讯内部及海外投资工作室的基础设施与网络需求,将客户需求转化为可落地的产品工具,并指导开发团队完成工具开发与实施 基于对腾讯游戏海外整体多云资源大盘的理解,梳理流程、工具层面的优化和解决问题思路,沉淀成行业最佳实践解决方案,并在更多工作室中推广和复用; 引进行业先进的产品&技术方案能力,负责评估测试和技术整合方案制定实施,与部门内部的其他团队合作,完善腾讯游戏海外的技术能力; 梳理和制定产品能力方向的中长期规划,结合团队内部的开发资源,将固化下来的流程工具转化为产品能力,包括并不局限与多云资源管理、多云网络规划、多云游戏安全、多云游戏Devops等领域 Work Location: China-Shenzhen
1、负责交易系统稳定性体系建设,包括变更管控、全链路监控、故障治理、混沌工程、容灾系统建设、可观测能力建设等,保障交易系统安全、可靠、稳定运行; 2、负责交易系统稳定性薄弱点识别和痛点解决,持续进行系统架构优化,负责技术难点攻坚,提升交易系统可靠性和稳定性; 3、负责交易系统整体的端到端架构、研发、测试和线上质量,能够将研发和测试能力平台化、自动化、服务化;
1、负责公有云IaaS、PaaS客户稳定性机制的构建工作,涵盖故障观测、响应机制建立、快速止损措施制定以及系统性改进建设,以确保客户线上业务稳定、可靠运行; 2、负责识别当前客户使用云产品全链路环节的可靠性,通过指标量化评估客户系统部署的健康程度,持续优化系统架构,从故障检测、通知与响应机制、自动恢复和止损效率等方面进行提升,增强IaaS产品的可靠性和稳定性; 3、负责推动IaaS&PaaS客户使用云产品最佳实践的落地,借助风险筛查、隐患排查等亚健康观测手段,帮助客户发现资源使用和系统架构方面的改进点,并协同客户团队落实改进措施; 4、持续跟踪业界前沿技术方案,结合IaaS、PaaS相关实际业务场景,不断迭代引入新技术和新方案,如AI OPS、观测降噪和精准,智能辅助运维等。