字节跳动媒体数据存储系统工程师/专家-视频与边缘
任职要求
1、本科及以上学历,2年及以上服务端开发经验,强悍的系统设计及编码能力; 2、算法、数据结构、操作系统等基础知识扎实,优秀的逻辑思维能力; 3、精通主流语言的至少一门Go/C/C++/Java/Python/Erlang/Rust等; 4、良好的沟通能力和团队合作精神,有一定的组织协调能力; 5、热爱技术,具备快速学习能力,做事情严谨踏实,团队协作能力强。 加分项: 1、熟悉Fuse用户态文件系统、分布式缓存系统(例如Alluxio/JuiceFS/GooseFS/JindoFS)等; 2、熟悉高性能网络通信(NVLink/RDMA/NCCL/GPU Direc)等; 3、深入理解向量索引算法,有向量检索研发和性能优化经验(Milvus/Weaviate/等),有数据库引擎核心研发经验(RocksDB/LevelDB/MySQL/MongoDB/Cassandra/HBase/InfluxDB等)。
工作职责
1、负责存储相关组件的设计和开发,服务于大模型推理和训练场景,包括模型分发加载、KV Cache存储和优化,数据IO性能优化,提高核心性能指标; 2、负责设计和实现面向面向海量数据模型训练和视频转码的分布式缓存文件系统,使用内存、SSD、HDD以及云端对象存储等介质进行数据的持久化存储和管理,均衡的优化存储性能与成本; 3、负责设计和实现面向多模态内容理解和检索元数据管理服务。
1、负责存储相关组件的设计和开发,服务于大模型推理和训练场景,包括模型分发加载、KV Cache存储和优化,数据IO性能优化,提高核心性能指标; 2、负责设计和实现面向面向海量数据模型训练和视频转码的分布式缓存文件系统,使用内存、SSD、HDD以及云端对象存储等介质进行数据的持久化存储和管理,均衡的优化存储性能与成本; 3、负责设计和实现面向多模态内容理解和检索元数据管理服务。
1、负责存储相关组件的设计和开发,服务于大模型推理和训练场景,包括模型分发加载、KV Cache存储和优化,数据IO性能优化,提高核心性能指标; 2、负责设计和实现面向海量数据模型训练和视频转码的分布式缓存文件系统,使用内存、SSD、HDD以及云端对象存储等介质进行数据的持久化存储和管理,均衡的优化存储性能与成本; 3、负责设计和实现面向多模态内容理解和检索元数据管理服务。
团队介绍: 7 亿快手用户每天都在生产百 PB 级的数据,需要被长期地记录下来,这些数据包括媒体数据、用户及业务的画像与行为数据、大模型的样本与训练数据等,这些都属于快手的高价值数字资产。存储团队的职责,就是以极高的性价比为快手和用户保障数据的稳固。 随着 AGI 时代的临近,存储的边界也在被重新定义,目前我们正处于存储发展的关键时期,这是一个充满技术挑战与行业影响力的机会,如果你对分布式存储系统、分布式缓存系统或性能优化充满热情,欢迎加入我们,一起应对高复杂业务场景,驱动技术发展,创造行业价值。 1、负责存储相关组件的设计与开发,服务于大模型训练及推理场景,包括模型分发、KV Cache、并行 IO 优化等,提高核心性能指标; 2、负责设计和实现面向海量数据的分布式缓存,综合利用本地内存、本地 SSD 以及远端存储系统(对象存储/HDFS)等进行数据的存储和迁移管理,实现「近计算端缓存+远端大容量存储」的一体化分级系统; 3、负责设计和实现高效、易用的数据访问接口,实现和推理框架、引擎的无缝对接; 4、负责存储与缓存的接入、管理、运维、监控,确保稳定性。