字节跳动向量内核研发工程师/专家
任职要求
1、至少深入了解 C/C++/Go 编程语言之一,熟悉多线程与异步编程技术,有性能优化和高质量工程意识; 2、深入理解向量索引算法,有向量检索性能优化经验; 3、熟悉 Milvus、Weaviate、Qdrant、Chroma、Faiss 等开源向量数据库实现优先; 4、掌握数据库引擎核心研发优先,包括但不限于:自研数据库引擎、RocksDB/LevelDB、MySQL、MongoDB、Cassandra、HBase、InfluxDB 等分布式或单机引擎; 5、具有较强的分析问题解决问题的能力,对新技术有强烈的好奇心,具有快速学习和与团队高效协作沟通的能力; 6、有 ACM 等竞赛获奖经历优先。
工作职责
团队介绍:基础架构数据库 CDI(Common Data Infra)团队支撑字节核心业务板块的数据基础设施建设,深度参与业务存储/数据架构的演进工作。团队负责面向 Base 领域的分布式数据库 FxDB 和向量数据库等产品的研发和迭代,深耕前沿数据库技术,助力业务提升核心技术品质。 1、负责向量索引构建、向量检索等核心算法的实现和性能优化; 2、负责高性能向量数据库的架构设计、功能迭代、以及产品化; 3、针对泛 AI 产品业务场景下的特定需求,提出解决方案并落地。
团队介绍:基础架构数据库 CDI(Common Data Infra)团队支撑字节核心业务板块的数据基础设施建设,深度参与业务存储/数据架构的演进工作。团队负责面向 Base 领域的分布式数据库 FxDB 和向量数据库等产品的研发和迭代,深耕前沿数据库技术,助力业务提升核心技术品质。 1、负责向量索引构建、向量检索等核心算法的实现和性能优化; 2、负责高性能向量数据库的架构设计、功能迭代、以及产品化; 3、针对泛 AI 产品业务场景下的特定需求,提出解决方案并落地。
参与公司向量数据库的研发工作,设计研发新一代分布式向量数据库系统,支持AI、社交、搜索、推荐、广告、电商等核心业务场景 负责产品内核设计、开发测试、性能调优、管控与文档建设等全生命周期开发管理工作,针对业务发展需求进行系统演进,提供高可用、高可靠、高性价比的向量服务 学习和吸纳业界优秀的技术和理论成果,积极探索和拓展新的产品能力,持续提升产品的技术竞争力与服务水平
团队介绍:字节跳动基础架构数据库团队,致力于构建认知型数据基础设施,持续定义数据技术的未来边界。团队基于全栈自研技术,打造了涵盖关系型数据库、NoSQL 数据库、大规模图平台、多模态搜索、云原生中间件等十余项产品的数据库矩阵,用独创的技术架构实现事务处理、混合查询、智能检索等全场景覆盖。我们不仅支撑集团核心业务,更通过火山引擎为客户提供具备企业级稳定性的数据库产品,助力客户以数据驱动实现业务增长。团队在大规模分布式架构、极致性能计算/存储引擎、软硬协同优化等领域具备顶尖技术积淀。面向 AI 时代,我们正在突破传统架构边界:一方面深化 AI 原生驱动内核、AI 算子优化等创新方向,推动数据库向智能 Copilot 演进;另一方面聚焦超大规模图计算、分布式跨模态数据联邦查询等前沿领域,构建支持跨模态数据管理的下一代设施。我们践行“务实浪漫”的极客文化,既在 VLDB 、SIGMOD 等顶级会议持续输出突破性成果,又以商业落地为导向打造全场景的产品矩阵。团队汇聚众多顶尖数据库专家和卓越工程师,分布在国内/海外多地。现诚邀具备数据库内核研发经验、分布式系统架构能力及 AI 创新视野的优秀人才,共同探索技术无人区,定义 AI 时代的数据基座,赋能全球企业实现 AI 驱动的业务变革。 1、负责AI时代的数据库架构设计:涵盖支持AI/ML工作负载的新型数据库系统架构,优化AI模型训练与推理的数据访问效率;构建支持向量搜索、图计算、时序分析等AI场景的混合型数据库解决方案,探索LLM大模型与数据库系统的深度集成方案,如自然语言SQL生成、智能查询优化; 2、负责数据库智能策略研发:研发基于 AI 的数据库性能调优系统,包括自动索引推荐、查询计划优化、资源分配策略等;构建智能监控系统,实现异常检测、根因分析、容量预测等AIOps能力;开发自适应存储引擎,根据数据访问模式动态调整存储结构; 3、负责AI数据基础设施构建:构建AI数据基础设施,如支持特征工程、模型训练、推理服务的全流程数据管道架构,实现数据库与机器学习框架(TensorFlow/PyTorch)的高效对接; 4、负责AI与数据库结合的实践方案探索与落地:探索AI技术和数据库各产品结合的最佳实践方案并落地,服务超大规模的集团内部业务及火山引擎业务。