logo of bytedance

字节跳动弹性计算库存调度平台研发工程师

社招全职A165459地点:杭州状态:招聘

任职要求


1、本科及以上学历,计算机相关专业优先;
2、具备扎实的计算机理论基础,有扎实的操作系统、体系结构、数据结构算法功底;
3、熟悉云计算资源调度编排过程与原理,对产品售卖、资源运营、库存管理有一定经验;
4、熟悉常见的数据处理工具,参与过经营分析相关工作,具备较强的数据分析和建模能力;
5、有过平台研发经验,熟悉前后端技术体系,参与构建过…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责云计算 ECS 弹性产品的研发与迭代,对现有弹性售卖产品进行改进与优化;
2、负责云计算 ECS 产品调度策略的优化,通过数据分析手段,挖掘不同售卖场景下的资源优化空间;
3、负责云计算集群调度和资源运营系统的研发与迭代,实现水位运营、库存管理、调度策略、调度模拟等核心功能的产品化与平台化,输出标准化资源管理和测算工具集,支撑弹性产品的业务售卖;
4、负责云计算资源供给平台和基础运维通道的设计和研发,构建自动化和智能化的资源流转体系,提升资源运营效率。
包括英文材料
学历+
数据结构+
算法+
还有更多 •••
相关职位

logo of bytedance
社招A149463

1、负责云计算 ECS 弹性产品的研发与迭代,对现有弹性售卖产品进行改进与优化; 2、负责云计算 ECS 产品调度策略的优化,通过数据分析手段,挖掘不同售卖场景下的资源优化空间; 3、负责云计算集群调度和资源运营系统的研发与迭代,实现水位运营、库存管理、调度策略、调度模拟等核心功能的产品化与平台化,输出标准化资源管理和测算工具集,支撑弹性产品的业务售卖; 4、负责云计算资源供给平台和基础运维通道的设计和研发,构建自动化和智能化的资源流转体系,提升资源运营效率。

更新于 2024-08-12北京
logo of bytedance
社招A113168

1、负责云计算ECS弹性产品的研发与迭代,对现有弹性售卖产品进行改进与优化; 2、负责云计算ECS产品调度策略的优化,通过数据分析手段,挖掘不同售卖场景下的资源优化空间; 3、负责云计算集群调度和资源运营系统的研发与迭代,实现水位运营、库存管理、调度策略、调度模拟等核心功能的产品化与平台化,输出标准化资源管理和测算工具集,支撑弹性产品的业务售卖; 4、负责云计算资源供给平台和基础运维通道的设计和研发,构建自动化和智能化的资源流转体系,提升资源运营效率。

更新于 2025-05-12成都
logo of meituan
社招5年以上核心本地商业-基

架构设计与技术引领 负责企业级数据库系统中存算分离架构的整体设计与落地,推动传统数据库向云原生、弹性伸缩、高可用方向演进。 深入理解存储层(如分布式文件系统、对象存储、块存储)与计算层(如SQL引擎、事务处理、查询优化)的解耦机制,构建高效、低延迟、高并发的数据访问路径。 主导存算分离架构下的性能调优、资源隔离、弹性扩缩容、故障恢复等关键技术攻关。 核心技术攻关 解决存算分离场景下的数据一致性、缓存一致性、元数据同步、跨节点事务处理等核心难题。 优化远程数据访问(Remote Data Access)性能,包括RDMA、零拷贝、智能预取、数据本地性调度等。 探索新型存储介质(如NVMe SSD、持久内存PMem)在存算分离架构中的高效利用。 产品与平台化建设 参与或主导数据库产品(如自研云原生数据库、HTAP系统、分布式数据库)的架构演进,推动存算分离能力产品化。 构建存算分离架构下的监控、诊断、运维平台,提升系统可观测性与稳定性。 技术生态与协作 与基础设施团队(网络、存储、云平台)紧密协作,优化底层资源调度与数据流动效率。 跟踪国内外主流存算分离数据库(如Snowflake、Google BigQuery、AWS Aurora、TiDB Cloud、OceanBase等)的技术动态,输出技术洞察与演进建议。 指导中初级工程师,推动团队技术能力提升。 标准与规范制定 制定存算分离架构下的设计规范、性能评估标准、容灾方案等,确保系统长期可维护性。

更新于 2025-11-10北京
logo of bytedance
社招A174558

团队介绍:IaaS字节跳动基础架构IaaS团队致力于不断创新,推动云计算产业发展和IaaS架构演进。作为云计算基座我们服务了字节跳动旗下包括抖音、今日头条、西瓜视频、飞书等明星产品, 并通过火山引擎云基础产品服务外部客户:包括金融、汽车、游戏、电商、社交媒体、高端制造、科研院所等各行各业的丰富场景, 为亿级用户量的APP和ToB业务提供安全、稳定、高性价比的算力。 我们坚持全栈自研,软硬一体,全面拥抱云原生, 在技术上追求极致: -基于智能库存调度、精细化监控以及自动化运维能力, 来管理遍布全球超百万台规模的服务器集群; -自研高吞吐、低延迟、高弹性的网关网元以及高弹性高并发的计算存储服务来应对抖音春晚、双十一等各种流量洪峰; -打造万卡超大规模的GPU集群, 与机器学习平台、火山方舟一起构建了从基础设施到模型生态的完整解决方案; -此外,还提供和火山引擎公有云同源架构的veStack混合云平台,支撑客户的本地化部署和跨云资源的弹性伸缩等。 1、负责大模型训练和推理所需的IaaS基础设施的规划、建设与维护; 2、与业务团队密切合作,支持业务新算法和模型的集成,并优化其在IaaS基础设施上的性能; 3、开发和维护自动化工具,提高大规模模型基础设施的可观测性、可扩展性和可管理性; 4、跟踪业界AI新兴技术和行业趋势,参与新技术的研究与应用,推动基础设施的持续升级。

更新于 2024-07-05北京