字节跳动基础资源经营/成本专家-基础架构
任职要求
1、本科及以上学历,有IT基础设施资源/云产品经营管理经验;
2、熟悉服…工作职责
1、参与基础设施建设与运营,基于专业能力与全局视角,配合业务技术团队,对成本、效率等关键环节的经营结果负责; 2、深入理解业务逻辑,针对基础设施商品管理,成本优化等场景提供解决与持续改进方案,建设完整、敏捷、有前瞻性的经营管理体系; 3、通过数据分析与产品化驱动,构建以经营模型及核心指标为指引的管理工具,支持产品、团队工作的可量化可评价,持续提升平台自动化能力。
我们是字节跳动基础架构-私有云团队,主要为今日头条、抖音、国际化短视频、飞书、电商等内部业务提供云基础服务,覆盖服务研发的全生命周期,包括微服务框架、服务发布、服务治理、多云管理以及经营分析平台等方向。团队拥有超大规模的微服务数量、全球化的部署体系、复杂的多云场景。极致的服务性能、简单易用的研发体验、一致的多云管理以及精确的经营分析是团队持续追求的目标。 1、负责云平台的设计与开发工作,负责云平台的基础组件服务,包括但不限于:云服务管控、大规模资源调度系统、商品管理、经营分析、计费计量、报表平台、云平台资源、配额、预算、权限等横向平台建设; 2、抽象多云适配层,适配不同云环境,构建用云过程自助服务,业务通过简单操作,自动完成微服务、配置、存储数据的迁移流程; 3、构建高效稳定的云平台元数据管理服务、云平台构建和高级资源编排服务; 4、负责字节跳动基础架构技术中台交易体系的核心商品域业务需求开发、系统维护,完成需求分析、方案设计和实现; 5、负责商品系统的类目、成本、定价、规格等多个子域的系统设计与维护; 6、负责承载亿级应用程序引擎的研发:负责字节跳动业务架构设计构建高效的在离线服务托管平台; 7、设计研发PaaS/FaaS的关键组件,打造业界领先的无服务器平台Serverless。
我们是字节跳动基础架构-私有云团队,主要为今日头条、抖音、国际化短视频、飞书、电商等内部业务提供云基础服务,覆盖服务研发的全生命周期,包括微服务框架、服务发布、服务治理、多云管理以及经营分析平台等方向。团队拥有超大规模的微服务数量、全球化的部署体系、复杂的多云场景。极致的服务性能、简单易用的研发体验、一致的多云管理以及精确的经营分析是团队持续追求的目标。 1、负责云平台的设计与开发工作,负责云平台的基础组件服务,包括但不限于:云服务管控、大规模资源调度系统、商品管理、经营分析、计费计量、报表平台、云平台资源、配额、预算、权限等横向平台建设; 2、抽象多云适配层,适配不同云环境,构建用云过程自助服务,业务通过简单操作,自动完成微服务、配置、存储数据的迁移流程; 3、构建高效稳定的云平台元数据管理服务、云平台构建和高级资源编排服务; 4、负责字节跳动基础架构技术中台交易体系的核心商品域业务需求开发、系统维护,完成需求分析、方案设计和实现; 5、负责商品系统的类目、成本、定价、规格等多个子域的系统设计与维护; 6、负责承载亿级应用程序引擎的研发:负责字节跳动业务架构设计构建高效的在离线服务托管平台; 7、设计研发PaaS/FaaS的关键组件,打造业界领先的无服务器平台Serverless。
负责阿里云全球网络的服务化平台研发,包括但不限于平台开发、模型/算法构建、海量数据分析处理等。 阿里云基础设施网络研发事业部,负责整个阿里巴巴网络基础设施的研发、建设和运维,始终坚持利用软/硬件技术及研究,针对业务需求研发网络解决方案,给公司业务提供强有力支持。广域网架构与研发团队,作为网络研发事业部核心团队之一,负责设计、研究、建设、运营面向全球的阿里巴巴广域网络,实现网络的高可靠、高可用、低成本,并不断提升用户体验。 具体岗位职责: 1. 负责阿里全球网络的数据分析、网络优化、资源规划等自动化和智能化系统研发,包括但不限于面向稳定性保障、质量优化和成本经营的算法、模型和平台研发 2. 负责阿里全球网络的质量探测与保障、网络监控、流量采集、Qos管控等系统设计研发 3. 负责阿里全球网络流量调度系统设计和研发,实现云边一体、端网融合、全球加速等目标
业务支撑 • 参与构建灵骏经营平台的建设,构建AI Infra架构下的全生命周期的资源管理体系,持续提升AI基础设施的资源利用率 • 参与构建阿里云统一的池化服务,涵盖CPU和GPU,构建统一的算力市场服务,持续提升资源的利用率和资源的交付效率 • 通过数据分析等手段,持续推动业务的演进优化,提升资源运营效率 • 持续演进平台和系统模型,提升整体经营平台的技术能力 技术方案设计 • 收集、识别、分析客户需求,并确定技术方案的目标、范围和交付成果 • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等 技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现 • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等 稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠 • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能 技术预研 • 跟踪和了解新的产品技术和趋势,根据业务需要提供新的技术支持和建议。 技术规划 • 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。