logo of bytedance

字节跳动媒体数据存储系统工程师/专家-视频与边缘

社招全职2年以上A162987地点:北京状态:招聘

任职要求


1、本科及以上学历,2年及以上服务端开发经验,强悍的系统设计及编码能力;
2、算法数据结构、操作系统等基础知识扎实,优秀的逻辑思维能力;
3、精通主流语言的至少一门Go/C/C++/Java/Python/Erlang/Rust等;
4、良好的沟通能力和团队合作精神,有一定的组织协调能力;
5、热爱技术,具备快速学习能力,做事情严谨踏实,团队协作能力强。

加分项:
1、熟悉Fuse用户态文件系统、分布式缓存系统(例如Alluxio/JuiceFS/GooseFS/JindoFS)等;
2、熟悉高性能网络通信(NVLink/RDMA/NCCL/GPU Direc)等;
3、深入理解向量索引算法,有向量检索研发和性能优化经验(Milvus/Weaviate/等),有数据库引擎核心研发经验(RocksDB/LevelDB/MySQL/MongoDB/Cassandra/HBase/InfluxDB等)。

工作职责


1、负责存储相关组件的设计和开发,服务于大模型推理和训练场景,包括模型分发加载、KV Cache存储和优化,数据IO性能优化,提高核心性能指标;
2、负责设计和实现面向面向海量数据模型训练和视频转码的分布式缓存文件系统,使用内存、SSD、HDD以及云端对象存储等介质进行数据的持久化存储和管理,均衡的优化存储性能与成本; 
3、负责设计和实现面向多模态内容理解和检索元数据管理服务。
包括英文材料
学历+
系统设计+
算法+
数据结构+
Go+
C+
C+++
Java+
Python+
Erlang+
Rust+
缓存+
RocksDB+
MySQL+
MongoDB+
Cassandra+
HBase+
InfluxDB+
相关职位

logo of bytedance
社招2年以上A196935

1、负责存储相关组件的设计和开发,服务于大模型推理和训练场景,包括模型分发加载、KV Cache存储和优化,数据IO性能优化,提高核心性能指标; 2、负责设计和实现面向面向海量数据模型训练和视频转码的分布式缓存文件系统,使用内存、SSD、HDD以及云端对象存储等介质进行数据的持久化存储和管理,均衡的优化存储性能与成本; 3、负责设计和实现面向多模态内容理解和检索元数据管理服务。

更新于 2025-05-12
logo of bytedance
社招2年以上JHKY1

1、负责存储相关组件的设计和开发,服务于大模型推理和训练场景,包括模型分发加载、KV Cache存储和优化,数据IO性能优化,提高核心性能指标; 2、负责设计和实现面向海量数据模型训练和视频转码的分布式缓存文件系统,使用内存、SSD、HDD以及云端对象存储等介质进行数据的持久化存储和管理,均衡的优化存储性能与成本; 3、负责设计和实现面向多模态内容理解和检索元数据管理服务。

更新于 2020-11-05
logo of kuaishou
社招3年以上D8028

团队介绍: 7 亿快手用户每天都在生产百 PB 级的数据,需要被长期地记录下来,这些数据包括媒体数据、用户及业务的画像与行为数据、大模型的样本与训练数据等,这些都属于快手的高价值数字资产。存储团队的职责,就是以极高的性价比为快手和用户保障数据的稳固。 随着 AGI 时代的临近,存储的边界也在被重新定义,目前我们正处于存储发展的关键时期,这是一个充满技术挑战与行业影响力的机会,如果你对分布式存储系统、分布式缓存系统或性能优化充满热情,欢迎加入我们,一起应对高复杂业务场景,驱动技术发展,创造行业价值。 1、负责存储相关组件的设计与开发,服务于大模型训练及推理场景,包括模型分发、KV Cache、并行 IO 优化等,提高核心性能指标; 2、负责设计和实现面向海量数据的分布式缓存,综合利用本地内存、本地 SSD 以及远端存储系统(对象存储/HDFS)等进行数据的存储和迁移管理,实现「近计算端缓存+远端大容量存储」的一体化分级系统; 3、负责设计和实现高效、易用的数据访问接口,实现和推理框架、引擎的无缝对接; 4、负责存储与缓存的接入、管理、运维、监控,确保稳定性。

更新于 2025-07-13
logo of sohu
校招技术类

作为团队的工程核心,你将以后端系统研发为基础,同时负责构建和扩展支撑AI应用的研发工具链和基础设施,为业务创新提供稳定、高效的工程能力。 ●负责AI应用的后端系统设计、开发与维护,保障服务的高可用性、可扩展性和安全性。 ●负责AI研发全流程中的关键平台工具的设计与开发,包括但不限于:媒体内容数据平台、存储系统等 ●构建和维护核心的AI基础服务,如统一模型服务网关、向量数据库与检索引擎,为上层AI应用提供基础能力。 ●与算法、全栈及产品团队紧密协作,深入理解研发流程中的痛点,持续优化基础设施与工具链,赋能团队进行更前沿的AI探索。