字节跳动云原生时序引擎研发工程师
任职要求
1、计算机科学、信息技术或相关专业的本科及以上学历,扎实的计算机基础知识; 2、精通C++/Java语言,具备扎实的数据结构与算法知识,熟悉数据库系统原理和实现; 3、数据库内核开发或相关领域工作经验,熟悉开源时序内部架构优先,有数据库新型引擎(时序/搜索/文档等)开发经验者优先、有大型分布式系统开发经验者优先; 4、熟悉L…
工作职责
1、参与大规模分布式时序引擎系统设计和开发以及优化,保障系统在极高并发访问的场景下低延迟、高可用、高吞吐、可扩展; 2、基于云原生基础设施,建设弹性Serverless的平台化能力,为用户提供简单、高效、易用的分布式数据服务; 3、深度理解和支持内外部客户的业务需求,打造标杆客户,培养开发者生态; 4、学习和吸纳业界优秀的开源技术和理论成果,敢于探索、创新,拓展和丰富产品的能力。
1、参与大规模分布式时序引擎系统设计和开发以及优化,保障系统在极高并发访问的场景下低延迟、高可用、高吞吐、可扩展; 2、基于云原生基础设施,建设弹性Serverless的平台化能力,为用户提供简单、高效、易用的分布式数据服务; 3、深度理解和支持内外部客户的业务需求,打造标杆客户,培养开发者生态; 4、学习和吸纳业界优秀的开源技术和理论成果,敢于探索、创新,拓展和丰富产品的能力。
1.智能化平台架构设计:主导海量数据平台的自治大脑体系化建设,包括平台可观测/特征/评分体系、平台自治引擎、决策与生成式算法选型应用,构建覆盖数据研发、存算、治理等全栈场景的智能化座舱; 2.技术研发与产品落地:推动智能运维、自动化诊断、资源调度优化、智能资产治理等核心模块研发,探索AI4DB(如Auto-MV、Auto-Index、NL2SQL)、运筹算法与大数据组件的深度融合; 3.跨领域协同与价值交付:深入业务场景,联合数据研发、运维、算法团队,推动数据治理规范、资产质量提升及资源效率优化,实现平台能力与业务价值的双向闭环; 4.前沿技术探索:研究大模型Agent构建、Prompt优化、智能调度(如DAG优化、异构资源动态分配)、参数调优等技术方向,打造业内领先的智能化数据平台; 5.全生命周期管理:主导平台从需求分析、架构设计到规模化落地的全流程,制定SOP并沉淀方法论,确保系统高可用性与可扩展性。
1.智能化平台研发:参与海量数据平台的自治大脑体系化建设,包括平台可观测/特征/评分体系、平台自治引擎、决策与生成式算法选型应用,构建覆盖数据研发、存算、治理等全栈场景的智能化座舱; 2.技术研发与产品落地:推动智能运维、自动化诊断、资源调度优化、智能资产治理等核心模块研发,探索AI4DB(如Auto-MV、Auto-Index、NL2SQL)、运筹算法与大数据组件的深度融合; 3.3. 跨领域协同与价值交付:深入业务场景,联合数据研发、运维、算法团队,推动数据治理规范、资产质量提升及资源效率优化,实现平台能力与业务价值的双向闭环。
团队介绍:字节跳动基础架构数据库团队,致力于构建认知型数据基础设施,持续定义数据技术的未来边界。团队基于全栈自研技术,打造了涵盖关系型数据库、NoSQL 数据库、大规模图平台、多模态搜索、云原生中间件等十余项产品的数据库矩阵,用独创的技术架构实现事务处理、混合查询、智能检索等全场景覆盖。我们不仅支撑集团核心业务,更通过火山引擎为客户提供具备企业级稳定性的数据库产品,助力客户以数据驱动实现业务增长。团队在大规模分布式架构、极致性能计算/存储引擎、软硬协同优化等领域具备顶尖技术积淀。面向 AI 时代,我们正在突破传统架构边界:一方面深化 AI 原生驱动内核、AI 算子优化等创新方向,推动数据库向智能 Copilot 演进;另一方面聚焦超大规模图计算、分布式跨模态数据联邦查询等前沿领域,构建支持跨模态数据管理的下一代设施。我们践行“务实浪漫”的极客文化,既在 VLDB 、SIGMOD 等顶级会议持续输出突破性成果,又以商业落地为导向打造全场景的产品矩阵。团队汇聚众多顶尖数据库专家和卓越工程师,分布在国内/海外多地。现诚邀具备数据库内核研发经验、分布式系统架构能力及 AI 创新视野的优秀人才,共同探索技术无人区,定义 AI 时代的数据基座,赋能全球企业实现 AI 驱动的业务变革。 1、负责AI时代的数据库架构设计:涵盖支持AI/ML工作负载的新型数据库系统架构,优化AI模型训练与推理的数据访问效率;构建支持向量搜索、图计算、时序分析等AI场景的混合型数据库解决方案,探索LLM大模型与数据库系统的深度集成方案,如自然语言SQL生成、智能查询优化; 2、负责数据库智能策略研发:研发基于 AI 的数据库性能调优系统,包括自动索引推荐、查询计划优化、资源分配策略等;构建智能监控系统,实现异常检测、根因分析、容量预测等AIOps能力;开发自适应存储引擎,根据数据访问模式动态调整存储结构; 3、负责AI数据基础设施构建:构建AI数据基础设施,如支持特征工程、模型训练、推理服务的全流程数据管道架构,实现数据库与机器学习框架(TensorFlow/PyTorch)的高效对接; 4、负责AI与数据库结合的实践方案探索与落地:探索AI技术和数据库各产品结合的最佳实践方案并落地,服务超大规模的集团内部业务及火山引擎业务。