阿里云阿里云智能-混合云存储管控技术专家-AI领域-上海/成都/杭州
任职要求
1. 编程基本功扎实,熟悉数据结构和算法,精通Java语言,掌握JVM原理、多线程编程; 2. 熟练使用常用框架(如Spring,SpringBoot,MyBatis 等)和常用中间件(如NoSql、消息系统、分…
工作职责
1. 负责文件存储管控系统中资源管理,权限管理,数据管理和运营系统的开发工作; 2. 优化CPFS 产品的资源模型,负责AI Storage新一代的资源管理框架,满足智算场景下各类规模客户的资源管理诉求; 3. 参与建设文件存储管控系统的高可用体系,包括流量均衡、自适应容灾、故障自动化处理等,确保业务持续可用、保障线上系统稳定及安全合规能力; 4. 持续提升文件存储管控系统的用户体验,深入理解文件存储的业务,解决客户使用文件存储产品中的痛点和难点,改进不合理的设计,提升产品易用性。
1. 智能存储架构设计 主导混合云环境下的SAN/NAS融合架构设计,制定跨品牌存储资源池化方案 设计基于AI的FC SAN网络动态路径优化系统,实现Brocade 720级交换网络智能负载均衡,端到端延迟波动≤0.5ms 2. 生产级存储SLA保障 构建存储健康度数字系统,通过实时IO热力图分析实现存储性能瓶颈提前72小时预警(检测准确率≥98%) 主导多厂商存储固件升级制定零停机滚动升级方案,确保关键业务可用性≥99.999% 3. 灾备韧性体系建设 设计跨地域存储双活(HyperMetro+SRDF同步复制)与CDP持续数据保护混合方案,达成核心系统RPO=0且RTO≤180秒的军工级可靠性标准 建立灾备剧本库,通过模拟全链路故障,验证TB级Oracle RAC集群分钟级恢复能力
• 与团队通力合作,以便发现和评估业务机会,了解客户在技术方面的异议,并制定策略来消除技术障碍。 • 分享 Google Cloud 专业知识,为 Google 与客户之间的技术合作提供支持,包括做好技术宣传、支持出价响应、通报产品和解决方案的情况、进行概念验证工作,以及与产品管理人员直接合作,以便优先开发那些影响客户是否采用 Google Cloud 的解决方案。 • 与客户合作,演示 Google Cloud 产品在客户/合作伙伴环境中的集成效果,并设计集成方案原型。 • 推荐所需的集成策略、企业架构、平台和应用基础设施,以便客户/合作伙伴利用 Google Cloud 的最佳实践实施全套解决方案。 • 争取潜在客户和获取新客户,建立并巩固客户关系,并成为客户在做出技术和业务决策时可信赖的顾问。
1、云产品稳定性保障,风险巡检:客户云产品稳定性、体验相关事项治理,产品风险巡检,故障的应急跟进与处理; 2、客户技术专项处置与支持:复杂、疑难问题/技术方案/活动护航保障/产研共建专项主导与管理工作; 3、排查问题,管控体验:高效排查解决产品技术售后问题,在服务过程中关注客户体验提升、有效管控客情; 4、专精客户行业,技术沉淀:提炼客户行业技术服务方案,沉淀内部技术文档,持续提高公共云/混合云各行业最佳实践能力;
我们是字节跳动基础架构-私有云团队,主要为今日头条、抖音、国际化短视频、飞书、电商等内部业务提供云基础服务,覆盖服务研发的全生命周期,包括微服务框架、服务发布、服务治理、多云管理以及经营分析平台等方向。团队拥有超大规模的微服务数量、全球化的部署体系、复杂的多云场景。极致的服务性能、简单易用的研发体验、一致的多云管理以及精确的经营分析是团队持续追求的目标。 1、负责云平台的设计与开发工作,负责云平台的基础组件服务,包括但不限于:云服务管控、大规模资源调度系统、商品管理、经营分析、计费计量、报表平台、云平台资源、配额、预算、权限等横向平台建设; 2、抽象多云适配层,适配不同云环境,构建用云过程自助服务,业务通过简单操作,自动完成微服务、配置、存储数据的迁移流程; 3、构建高效稳定的云平台元数据管理服务、云平台构建和高级资源编排服务; 4、负责字节跳动基础架构技术中台交易体系的核心商品域业务需求开发、系统维护,完成需求分析、方案设计和实现; 5、负责商品系统的类目、成本、定价、规格等多个子域的系统设计与维护; 6、负责承载亿级应用程序引擎的研发:负责字节跳动业务架构设计构建高效的在离线服务托管平台; 7、设计研发PaaS/FaaS的关键组件,打造业界领先的无服务器平台Serverless。