logo of bytedance

字节跳动训练推理一体化存储研发高级工程师-Data

社招全职3年以上A56142地点:北京状态:招聘

任职要求


1、3年以上相关领域开发经验,扎实的编程能力,精通C/C++/Java中的一种;
2、对分布式系统的架构和原理有比较深入的了解;
3、优秀的发现和解决问题能力,良好的沟通能力,具备团队合作精神。

加分项:
1、拥抱开源,有开源项目经…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:推荐架构团队支撑字节跳动旗下多款APP产品,如抖音、今日头条、番茄小说、西瓜视频、剪映等推荐系统架构的设计和开发,保障系统的稳定和高可用,致力于抽象系统通用组件和服务,建设推荐中台、数据中台;关于在线服务,在这里你有机会参与大规模机器学习在线预估框架的研发与优化,也有机会参与模型训练与调度等相关问题的研究与突破,解决系统瓶颈,降低成本开销;如你对大数据感兴趣,在这里也有机会参与通用实时计算系统的开发、构建统一的推荐特征中台,为推荐业务实现先进的消重、计数、特征服务等;我们期待热爱技术的你加入,一起创造更多可能。

1、负责设计和实现面向推荐/广告大模型推理和训练的多层级存储系统,综合利用显存、本地内存、分布式内存/磁盘、远端大容量存储系统(HDFS)等多种介质进行数据的存储和迁移管理,实现近计算缓存+远端大容量存储的一体化分级系统;
2、负责优化推荐大模型KV Cache命中率,从推理框架、流量调度、多级缓存等多个系统维度入手定制化优化策略,和业务方协作完成端到端推理性能加速;
3、负责建设搜广推通用用户行为数据存储,设计和实现离在线EB级别行为数据的统一存储、IO、近端Cache解决方案,支撑EB级别训练和推理数据,提供高可用保障,在离在线混合负载下,高吞吐和低延时能力的分布式存储系统。
包括英文材料
C+
C+++
Java+
分布式系统+
Paxos+
还有更多 •••
相关职位

logo of kuaishou
社招3-5年J0011

1、对接视频/图片/音频等各类多模态模型的数据生产需求,打造业界领先的多模态数据生产引擎,持续提升训练数据的规模、质量和迭代效率,支撑可灵全系多模态生成模型训练; 2、搭建 Data Centric 的多模态数据处理 pipeline,包括数据处理算子开发、跨模态检索引擎开发、多模态数据的内容理解、质量筛选、组织与合成等关键环节; 3、构建高可用、高吞吐的数据算法服务框架,支持多模态模型服务的快速部署,通过各种技术手段持续优化性能,降低推理成本,包括但不限于:算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等; 4、设计并实现高可扩展、低成本的多模态数据存储架构,支持对象存储、文件系统及数据库技术的融合应用,参与多模态数据管理体系的建设,实现统一的元数据标准、数据编目、版本控制和生命周期管理; 5、构建跨模态数据关联与检索能力,支持基于内容的相似性搜索、标签检索和多模态联合查询; 6、跟踪业界前沿技术(如向量数据库、云原生存储、数据湖仓一体等),推动系统持续演进。

更新于 2026-04-09北京
logo of bytedance
校招A164099

团队介绍:字节芯片研发团队目前工作主要集中在芯片设计环节,主要围绕字节自身业务展开芯片探索,为字节多项业务的专用场景定制硬件优化,设计多款基于先进半导体工艺的云端复杂芯片,以期提升性能、降低成本。早期若干芯片项目已经进入到量产部署阶段,有多次一版成功的投片经历,所用工艺包含多个主流的先进工艺节点。与基础设施各团队之间工作的整体协同,能更容易和更好地发挥芯片研发的价值。 课题介绍: 研究方向:集成电路设计、计算机体系结构、半导体、存储系统、机器学习系统、计算机网络。 芯片设计 1、负责AI芯片架构/微架构探索与方案设计,包括AI推理/训练系统软硬件协同优化、AI模型与算子特性分析、硬件实现方案制定与性能优化、数据中心ASIC芯片微架构探索、RTL设计与集成、业内先进AI芯片微架构跟踪调研、benchmark总结与搭建、芯片互联网络协议与架构演进; 2、重点投入到AI芯片架构、微架构、AI工具链、Scale up/Scale out/Switch等方向。 芯片物理层设计 1、负责ASIC/CPU芯片的物理层研发,具体包括逻辑综合、可测性设计、后端设计、定制IP设计、封装仿真、硅后研发等环节; 2、重点投入到高级封装、高性能IP设计、高性能设计方法学、物理前沿技术(AI for EDA、DTCO)等方向。 课题挑战: 1、探索AI计算、高速互联、存储、先进封装一体化协同架构; 2、负责创新架构与系统设计; 3、与软硬件团队协同,落地AI训练/推理芯片与数据中心系统。 课题价值: 不断探索芯片前沿架构,支持字节火山引擎、抖音、豆包等业务,持续扩展应用领域,赋能LLM、视频/图片生成、视觉理解等大模型方向。以高性能、高精度、高可用性、低成本为目标,提供端云全场景覆盖、软硬件协同的AI芯片和系统解决方案。

更新于 2026-04-14北京
logo of bytedance
实习A178499

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:推荐架构团队支撑字节跳动旗下多款APP产品,如抖音、今日头条、番茄小说、西瓜视频、剪映等推荐系统架构的设计和开发,保障系统的稳定和高可用,致力于抽象系统通用组件和服务,建设推荐中台、数据中台;关于在线服务,在这里你有机会参与大规模机器学习在线预估框架的研发与优化,也有机会参与模型训练与调度等相关问题的研究与突破,解决系统瓶颈,降低成本开销;如你对大数据感兴趣,在这里也有机会参与通用实时计算系统的开发、构建统一的推荐特征中台,为推荐业务实现先进的消重、计数、特征服务等;我们期待热爱技术的你加入,一起创造更多可能。 1、负责设计和实现面向推荐/广告大模型推理和训练的多层级存储系统,综合利用显存、本地内存、分布式内存/磁盘、远端大容量存储系统(HDFS)等多种介质进行数据的存储和迁移管理,实现近计算缓存+远端大容量存储的一体化分级系统; 2、负责优化推荐大模型KV Cache命中率,从推理框架、流量调度、多级缓存等多个系统维度入手定制化优化策略,和业务方协作完成端到端推理性能加速; 3、负责建设搜广推通用用户行为数据存储,设计和实现离在线EB级别行为数据的统一存储、IO、近端Cache解决方案,支撑EB级别训练和推理数据,提供高可用保障,在离在线混合负载下,高吞吐和低延时能力的分布式存储系统。

更新于 2026-01-14上海
logo of aliyun
社招5年以上云智能集团

1. 深入理解存储介质部件软硬件技术,熟悉存储介质(如CMR HDD,SMR HDD,NVME SSD,SCM等)、存储互联技术(如Ethernet,RDMA等)架构以及产品,文件系统和设备驱动的架构和实现, 开发软硬件一体化的高性能存储产品满足阿里巴巴云数据中心的业务挑战和需要; 2. 深入理解存储业务应用,对分布式文件系统,块存储,对象存储,文件存储,以及大数据平台进行深入分析,了解阿里业务情况与用户需求,制高性能,低成本存储软硬件技术和产品的发展路线; 3 深入理解AI场景训练推理存储系统需求及存储容器化部署方案,结合业务场景需求制定开发面向AI场景训练,推理存储软硬件一体化解决方案; 4. 与阿里云各软硬件团队合作,开发针对大容量,高性能存储的存储引擎、文件系统等。

更新于 2025-11-14杭州