阿里云诚云科技-资深运维工程师(交付方向)-政企技术服务-应用及数据云化架构师
任职要求
• 在中型企业或云服务提供商从事SRE、运维工具开发、客户技术服务相关工作,具备3年及以上工作经验
• 熟悉云集群各运维平台和云产品及监控平台使用方法,能够快速专业定位客户问题
• 具备一定集群调优和trouble shooting能力
• 或者掌握分布式系统原理,对存储、计算、流式计算中的一项或多项有深…工作职责
1、客户现场专项技术负责人,如网络专项、数据库专项; 2、平台稳定性重大变更方案制定与实施,如性能/存储优化、底座改造等; 3、现场故障应急执行,协助原厂尽快恢复平台运行; 4、关键时刻现场保障,如客户平台隐患深度排查与治理; 5、复杂问题原因定位及解决;
1、客户现场专项技术负责人,如网络专项、数据库专项; 2、平台稳定性重大变更方案制定与实施,如性能/存储优化、底座改造等; 3、现场故障应急执行,协助原厂尽快恢复平台运行; 4、关键时刻现场保障,如客户平台隐患深度排查与治理; 5、复杂问题原因定位及解决;
1、负责集团数据中心的基础设施建设、运维管理工作,统筹资源安排,制定数据中心服务策略,确保数据中心安全、可靠、高效运营; 2、负责集团自建机房的项目技术管理,包括电气技术选型、建设交付、测试验收等工作,与总包和设备供应商、监理单位等密切配合,保障新建项目的高效、高质量交付; 2、探索数据中心电气专业前沿技术,负责集团IDC新技术的规划、迭代及落地工作; 3、负责集团数据中心的基础设施现场运维质量、运维成本及运维安全,挖掘项目机会,增强团队影响力; 4、负责集团数据中心电气技术和运营持续优化,追求更高的可靠性、运营高效和最佳成本。
1、负责分析和设计芯片产品的规模化交付稳定性解决方案,通过实现和优化各类软硬件架构和接口提升产品在关键场景下的稳定性指标; 2、与上下游团队协作,建立和牵引芯片产品的线上服务质量目标,综合运用技术和流程方法保障目标达成; 3、组织和参与芯片产品重大线上技术问题的攻关,推动问题解决。
团队介绍:国际化内容安全平台团队致力于为字节跳动国际化产品的用户维护安全可信赖环境,通过开发、迭代机器学习模型和信息系统以更早、更快发掘风险、监控风险、响应紧急事件,以人工智能技术支持业务发展,力求更高效、更敏捷、更全能地维护站内生态安全。 1、负责工程架构基础能力的探索、规划和建设,优化工程架构、质量、体验和效率,服务全球化内容审核平台; 2、完善Web工程架构体系并推进量化提升,包括但不限于微前端基座、Monorepo生态、架构运维方案等工程体系; 3、建设产品平台稳定性、用户体验、产品成熟度等度量体系,提升产品平台用户体验的度量能力并持续推升; 4、建设技术工程指标管理运营体系,通过指标管理运营标准化、自动根因分析联动等能力,提升工程状态可观测性和问题发现效率; 5、探索AI与工程体系的结合可能,建设分业务场景和工程流程的AI解决方案,助力需求交付质量和效率提升。