logo of bytedance

字节跳动弹性计算库存调度平台研发工程师

社招全职A149463地点:北京状态:招聘

任职要求


1、本科及以上学历,计算机相关专业优先;
2、具备扎实的计算机理论基础,有扎实的操作系统、体系结构、数据结构算法功底;
3、熟悉云计算资源调度编排过程与原理,对产品售卖、资源运营、库存管理有一定经验;
4、熟悉常见的数据处理工具,参与过经营分析相关工作,具备较强的数据分析和建模能力;
5、有过平台研发经验,熟悉前后端技术体系,参与构建过平台化产品;
6、有较强的分析和沟通能力,具备良好的团队协作精神,能够协调上下游密切合作实现业务目标。

具备以下条件之一者优先
-有云计算相关工作经验,熟悉云计算 ECS 弹性云产品以及常见的售卖形态;
-有分布式系统的实践管理经验,熟悉 Kubernets、Openstack、Yarn分布式系统,对业界计算基础设施动向有较强的热情。

工作职责


1、负责云计算 ECS 弹性产品的研发与迭代,对现有弹性售卖产品进行改进与优化;
2、负责云计算 ECS 产品调度策略的优化,通过数据分析手段,挖掘不同售卖场景下的资源优化空间;
3、负责云计算集群调度和资源运营系统的研发与迭代,实现水位运营、库存管理、调度策略、调度模拟等核心功能的产品化与平台化,输出标准化资源管理和测算工具集,支撑弹性产品的业务售卖;
4、负责云计算资源供给平台和基础运维通道的设计和研发,构建自动化和智能化的资源流转体系,提升资源运营效率。
包括英文材料
学历+
数据结构+
算法+
数据分析+
分布式系统+
Yarn+
相关职位

logo of bytedance
社招A165459

1、负责云计算 ECS 弹性产品的研发与迭代,对现有弹性售卖产品进行改进与优化; 2、负责云计算 ECS 产品调度策略的优化,通过数据分析手段,挖掘不同售卖场景下的资源优化空间; 3、负责云计算集群调度和资源运营系统的研发与迭代,实现水位运营、库存管理、调度策略、调度模拟等核心功能的产品化与平台化,输出标准化资源管理和测算工具集,支撑弹性产品的业务售卖; 4、负责云计算资源供给平台和基础运维通道的设计和研发,构建自动化和智能化的资源流转体系,提升资源运营效率。

更新于 2024-08-12
logo of bytedance
社招A113168

1、负责云计算ECS弹性产品的研发与迭代,对现有弹性售卖产品进行改进与优化; 2、负责云计算ECS产品调度策略的优化,通过数据分析手段,挖掘不同售卖场景下的资源优化空间; 3、负责云计算集群调度和资源运营系统的研发与迭代,实现水位运营、库存管理、调度策略、调度模拟等核心功能的产品化与平台化,输出标准化资源管理和测算工具集,支撑弹性产品的业务售卖; 4、负责云计算资源供给平台和基础运维通道的设计和研发,构建自动化和智能化的资源流转体系,提升资源运营效率。

更新于 2025-05-12
logo of bytedance
社招A174558

团队介绍:IaaS字节跳动基础架构IaaS团队致力于不断创新,推动云计算产业发展和IaaS架构演进。作为云计算基座我们服务了字节跳动旗下包括抖音、今日头条、西瓜视频、飞书等明星产品, 并通过火山引擎云基础产品服务外部客户:包括金融、汽车、游戏、电商、社交媒体、高端制造、科研院所等各行各业的丰富场景, 为亿级用户量的APP和ToB业务提供安全、稳定、高性价比的算力。 我们坚持全栈自研,软硬一体,全面拥抱云原生, 在技术上追求极致: -基于智能库存调度、精细化监控以及自动化运维能力, 来管理遍布全球超百万台规模的服务器集群; -自研高吞吐、低延迟、高弹性的网关网元以及高弹性高并发的计算存储服务来应对抖音春晚、双十一等各种流量洪峰; -打造万卡超大规模的GPU集群, 与机器学习平台、火山方舟一起构建了从基础设施到模型生态的完整解决方案; -此外,还提供和火山引擎公有云同源架构的veStack混合云平台,支撑客户的本地化部署和跨云资源的弹性伸缩等。 1、负责大模型训练和推理所需的IaaS基础设施的规划、建设与维护; 2、与业务团队密切合作,支持业务新算法和模型的集成,并优化其在IaaS基础设施上的性能; 3、开发和维护自动化工具,提高大规模模型基础设施的可观测性、可扩展性和可管理性; 4、跟踪业界AI新兴技术和行业趋势,参与新技术的研究与应用,推动基础设施的持续升级。

更新于 2024-07-05
logo of bytedance
社招A70425

团队介绍:IaaS字节跳动基础架构IaaS团队致力于不断创新,推动云计算产业发展和IaaS架构演进。作为云计算基座我们服务了字节跳动旗下包括抖音、今日头条、西瓜视频、飞书等明星产品, 并通过火山引擎云基础产品服务外部客户:包括金融、汽车、游戏、电商、社交媒体、高端制造、科研院所等各行各业的丰富场景, 为亿级用户量的APP和ToB业务提供安全、稳定、高性价比的算力。 我们坚持全栈自研,软硬一体,全面拥抱云原生, 在技术上追求极致: -基于智能库存调度、精细化监控以及自动化运维能力, 来管理遍布全球超百万台规模的服务器集群; -自研高吞吐、低延迟、高弹性的网关网元以及高弹性高并发的计算存储服务来应对抖音春晚、双十一等各种流量洪峰; -打造万卡超大规模的GPU集群, 与机器学习平台、火山方舟一起构建了从基础设施到模型生态的完整解决方案; -此外,还提供和火山引擎公有云同源架构的veStack混合云平台,支撑客户的本地化部署和跨云资源的弹性伸缩等。 1、负责大模型训练和推理所需的IaaS基础设施的规划、建设与维护; 2、与业务团队密切合作,支持业务新算法和模型的集成,并优化其在IaaS基础设施上的性能; 3、开发和维护自动化工具,提高大规模模型基础设施的可观测性、可扩展性和可管理性; 4、跟踪业界AI新兴技术和行业趋势,参与新技术的研究与应用,推动基础设施的持续升级。

更新于 2024-07-30