美团AI搜索-数据架构(知识库方向)
任职要求
1. 计算机相关专业本科及以上学历,3年以上后端开发经验,主导过数据密集型系统架构设计。 2. 熟悉知识库技术栈(RAG、GraphRAG、LangChain、LangGraph、MCP、LlamaIndex),掌握多模态大模型应用、工具调用(Function Call)技术。 3. 精通Java及Spring Boot/Cloud生态,熟悉分布式中间件(Kafka、Redis)、微服务架构与高并发设计。 4. 具备复杂业务系统全链路开发能力,熟悉容器化部署及DevOps流程。 5. 有搜索推荐场景的意图识别、个性化排序策略实践经验者优先。 6. 逻辑清晰,能快速对齐业务需求并设计高可用解决方案,适应高强度协作环境 具备以下条件优先 1. 熟悉开源知识库系统(如Milvus、Elasticsearch)的源码优化与二次开发,具备智能体评测体系(如Tracing、实验平台)建设经验。 2. 参与过AI竞赛(如Kaggle)、开源项目贡献,或对AI安全、模型可解释性有研究。 3. 具备搜索推荐系统、智能客服等场景实战经验,熟悉知识图谱与Agent架构的融合应用。
工作职责
1. 统一知识库架构设计:负责美团搜索推荐(搜推)平台的数据基建建设,设计并开发基于AI搜索的统一知识库架构,整合多模态数据(结构化/非结构化),构建高效检索增强系统。 2. 数据服务与系统集成:对接搜索推荐核心系统,优化查询理解、召回排序等环节的数据服务能力,支持高并发场景下的实时响应;构建知识库增量更新与版本管理机制,确保法律政策、行业数据等信息的实时性与一致性。 3. AI技术融合与性能优化:集成大模型推理、检索增强生成(RAG)、深度反思等技术,提升知识库在搜索场景中的语义理解与决策能力;针对超大规模数据处理场景,优化分布式训练加速、资源调度及容错机制,保障系统稳定性。
1. 系统架构与工程落地 ● 负责AI Agent框架设计与实现,构建高可用、低延迟的AI Agent生产环境,支持百万级以上用户量的应用、部署平台 ● 负责智能体知识库、流程编排等功能开发,对接头部等流量等载体的接口,输出能力 ● 开发LLM应用基础设施,包括RAG 技术、Agent开发框架(如LangChain) MCP 协议等 ● 优化Agent与工具调用的协同机制,提升任务规划、自主决策和交互体验 ● 探索大模型与Agent技术的结合,解决复杂场景下的推理能力 2. 业务场景适配与创新 ● 推动AI Agent在搜索、营销、服务、DevOps运维等领域的落地 ● 设计符合行业需求的解决方案,如应用导购助理、客服助手、智能编程助手 ● 负责AI项目的推动落地,行业类Agent开发以及行业类RAG系统的架构设计与研发。 ● 负责技术预研、架构设计、业务模型抽象及功能开发保持对业务场景的敏锐洞察,快速熟悉业务流程并理解业务痛点,沟通并分析产品需求,制定技术方案,设计与研发核心系统及模块,推动产品快速迭代。
1.负责闲鱼搜索工程架构演进,搜索业务前台产品、流量调控策略&基建、特征工程,排序推理引擎性能优化,召回引擎升级和优化; 2.负责闲鱼推荐工程架构演进,推荐在离线链路工程架构设计和开发,排序推理引擎性能优化,闲鱼商品/内容等异构推荐架构探索; 3.负责闲鱼搜推统一大模型方向探索,结合LLM在搜索和推荐工程领域落地,探索适合闲鱼搜推统一大模型的Scalling Law; 4.负责领域内系统核心部分代码编写,疑难问题的解决,维护和升级现有软件产品和系统,快速定位并修复现有软件缺陷;
商品基础算法团队是淘天集团核心的商品理解中台,负责对淘天全域(淘宝、天猫等)数百亿的商品进行深度、精准、多维度的内容理解。我们产出的商品认知能力(如属性、卖点、风格、品类、知识),是整个淘天搜索、推荐、广告、AIGC应用、智能导购、直播等所有核心业务的基石,直接决定了用户“逛”和“买”的体验,是连接“人”与“货”的智能引擎。 当前,我们正处在用新一代AI技术(大模型、多模态大模型)彻底重塑商品世界的历史机遇期。在这里,你将接触到全球最丰富、最复杂的电商多模态数据,有机会定义下一代商品理解的技术范式,你的工作成果将通过集团各大业务场景,影响亿万用户的消费决策。 岗位职责: 1. 构建业界领先的商品多模态理解体系: 负责利用大语言模型(LLM)及视觉语言模型(VLM)等前沿技术,对商品的多模态内容(文本标题、详情描述、图片、视频等)进行深度解析,完成高质量的标签抽取、卖点挖掘、风格识别、需求理解等核心任务。 2. 探索大模型背景下的下一代商品知识库的构建范式:如何从海量商品信息、用户评论、行业知识中自动化构建知识体系?如何解决知识的事实性问题?如何在庞大、有噪声的知识库中抽取有效知识,用于下游落地和应用 3. 负责大模型/多模态模型的前沿技术探索与落地: 跟踪并实践领域内前沿的模型和技术(如模型Fine-tuning, RAG, In-Context Learning, Agent, Model Distillation等),结合业务场景进行技术选型、方案设计与模型优化,解决从训练到部署全链路的挑战,实现技术创新与业务效果的双赢。 4. 设计和优化算法架构与系统: 负责商品理解算法系统的整体架构设计与持续迭代,保证系统的高性能、高可用和高扩展性,以应对淘天集团海量数据的挑战。 5. 驱动技术创新转化为业务价值: 深入理解业务,主动挖掘技术能创造价值的场景,与产品、工程团队紧密协作,通过严谨的AB实验验证算法效果,用技术力量持续驱动业务指标增长。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动基础架构数据库团队,致力于构建认知型数据基础设施,持续定义数据技术的未来边界。团队基于全栈自研技术,打造了涵盖关系型数据库、NoSQL 数据库、大规模图平台、多模态搜索、云原生中间件等十余项产品的数据库矩阵,用独创的技术架构实现事务处理、混合查询、智能检索等全场景覆盖。我们不仅支撑集团核心业务,更通过火山引擎为客户提供具备企业级稳定性的数据库产品,助力客户以数据驱动实现业务增长。团队在大规模分布式架构、极致性能计算/存储引擎、软硬协同优化等领域具备顶尖技术积淀。面向 AI 时代,我们正在突破传统架构边界:一方面深化 AI 原生驱动内核、AI 算子优化等创新方向,推动数据库向智能 Copilot 演进;另一方面聚焦超大规模图计算、分布式跨模态数据联邦查询等前沿领域,构建支持跨模态数据管理的下一代设施。我们践行“务实浪漫”的极客文化,既在 VLDB 、SIGMOD 等顶级会议持续输出突破性成果,又以商业落地为导向打造全场景的产品矩阵。团队汇聚众多顶尖数据库专家和卓越工程师,分布在国内/海外多地。现诚邀具备数据库内核研发经验、分布式系统架构能力及 AI 创新视野的优秀人才,共同探索技术无人区,定义 AI 时代的数据基座,赋能全球企业实现 AI 驱动的业务变革。 1、参与字节跳动内部自研云原生数据库产品的设计和开发,打造业界领先的分布式OLTP/HTAP数据库产品; 2、参与字节跳动VeDB Family旗下数据库产品架构、功能迭代和服务化,研究云原生在数据库的应用技术并落地实现; 3、深入理解业务场景需求,针对性的为不同业务场景提供最合适的辅助工具,提高数据库产品的易用性、稳定性和运维能力。