京东基于(自动化)大语言模型在商品理解任务中的应用
任职要求
1、获得本科及以上学历,计算机、人工智能、自动化、数学、物理等相关专业;系统化的机器学习基础素养,有深刻的、问题驱动式的模型训练与调试能力; 2、NLP/CV/大模型基础知识扎实,熟悉或能快速上手…
工作职责
1、负责研发具备领域属性识别、商品匹配与商品分类等多任务能力的大模型; 2、研发LLM-as-a-Judge用于自动化评测,设计human-in-the-loop的校验机制,提高组内各方向例行评测效率与可信度; 3、研发与应用商品理解宪法,结合RAG、多Agentsdebate等方式,提升自研或外部LLM的商品理解效果; 4、探索多模态大模型对商品详情页甚至站点web页互连子图的理解能力(商详页包含文字、图片、半结构化信息,超链接等);
我们是一支充满活力与技术深度的自营行业算法团队,致力于驱动天猫超市、天猫国际等核心自营业务的智能化升级。在这里,我们不仅用数据理解消费趋势,更用算法重塑商品运营与客户服务——从“人工经验驱动”到“AI自主决策”,构建更具竞争力的商品供给与更高效、可规模化的智能服务体系。 我们积极拥抱生成式AI浪潮,已在多个关键场景实现落地突破: ● 商品侧:探索基于大模型的智能选品辅助、营销素材生成与合规性机审,提升商品上架效率与内容质量; ● 客服侧:构建支持多轮意图识别、任务规划与跨系统调用的智能客服Agent,实现从“问答匹配”到“问题解决”的跃迁。 当前,我们正打造以大模型为认知核心、Agent为执行载体的下一代智能体系统,覆盖商品全生命周期管理与用户服务闭环。加入我们,你将参与设计并落地真正意义上的AI原生电商引擎,推动业务进入自动化、可进化的新阶段。 岗位描述: 1. 负责大模型后训练与领域适配,参与通用大模型在自营场景下的微调、指令对齐与多轮对话优化,提升模型在商品问答、素材生成、客服应答等任务中的专业性与一致性。 2. 负责智能Agent体系的研发与落地,涵盖工具调用(Tool Use)、任务规划、状态管理与多Agent协作机制,实现在智能选品、客服QA等复杂场景中的端到端闭环执行。 3. 负责设计并优化检索增强(RAG)系统,从索引构建、召回排序到知识融合与上下文压缩,全面提升RAG在商品知识、营销信息、服务标准等高准确性需求场景下的效果与稳定性。 4. 负责建立科学评测体系,设计覆盖功能性、合规性、一致性与业务转化的多维评估指标,系统分析模型表现,指导模型与Agent策略的精准优化。 5. 推进前沿技术在业务中的验证与落地,深入跟踪 LLM领域前沿进展,在真实场景中快速实验并应用。 6. 协同产品与工程团队,将算法能力高效集成至线上系统,兼顾性能、延迟与可用性,确保用户体验与业务目标双达成。 我们能提供: 1. 高价值业务场景:深耕天猫超市、天猫国际的商品与客服体系,覆盖跨境选品、用户咨询、履约售后等完整链路,技术直击业务核心。 2. 快速闭环验证:依托自营决策权,算法可快速上线并反馈于转化率、响应准确率、人力替代率等核心指标。 3. 丰富数据与资源支持:拥有完整的商品知识库、用户行为流与客服对话日志,支撑高质量训练与评测。 4. 复合成长路径:在技术深度(大模型/Agent)与业务广度(电商/跨境/客服)双重挑战中成长,核心骨干带教支持,晋升通道畅通。

我们是一支充满活力与技术深度的自营行业算法团队,致力于驱动天猫超市、天猫国际等核心自营业务的智能化升级。在这里,我们不仅用数据理解消费趋势,更用算法重塑商品运营与客户服务——从“人工经验驱动”到“AI自主决策”,构建更具竞争力的商品供给与更高效、可规模化的智能服务体系。 我们积极拥抱生成式AI浪潮,已在多个关键场景实现落地突破: ● 商品侧:探索基于大模型的智能选品辅助、营销素材生成与合规性机审,提升商品上架效率与内容质量; ● 客服侧:构建支持多轮意图识别、任务规划与跨系统调用的智能客服Agent,实现从“问答匹配”到“问题解决”的跃迁。 当前,我们正打造以大模型为认知核心、Agent为执行载体的下一代智能体系统,覆盖商品全生命周期管理与用户服务闭环。加入我们,你将参与设计并落地真正意义上的AI原生电商引擎,推动业务进入自动化、可进化的新阶段。 岗位描述: 1. 负责大模型后训练与领域适配,参与通用大模型在自营场景下的微调、指令对齐与多轮对话优化,提升模型在商品问答、素材生成、客服应答等任务中的专业性与一致性。 2. 负责智能Agent体系的研发与落地,涵盖工具调用(Tool Use)、任务规划、状态管理与多Agent协作机制,实现在智能选品、客服QA等复杂场景中的端到端闭环执行。 3. 负责设计并优化检索增强(RAG)系统,从索引构建、召回排序到知识融合与上下文压缩,全面提升RAG在商品知识、营销信息、服务标准等高准确性需求场景下的效果与稳定性。 4. 负责建立科学评测体系,设计覆盖功能性、合规性、一致性与业务转化的多维评估指标,系统分析模型表现,指导模型与Agent策略的精准优化。 5. 推进前沿技术在业务中的验证与落地,深入跟踪 LLM领域前沿进展,在真实场景中快速实验并应用。 6. 协同产品与工程团队,将算法能力高效集成至线上系统,兼顾性能、延迟与可用性,确保用户体验与业务目标双达成。 我们能提供: 1. 高价值业务场景:深耕天猫超市、天猫国际的商品与客服体系,覆盖跨境选品、用户咨询、履约售后等完整链路,技术直击业务核心。 2. 快速闭环验证:依托自营决策权,算法可快速上线并反馈于转化率、响应准确率、人力替代率等核心指标。 3. 丰富数据与资源支持:拥有完整的商品知识库、用户行为流与客服对话日志,支撑高质量训练与评测。 4. 复合成长路径:在技术深度(大模型/Agent)与业务广度(电商/跨境/客服)双重挑战中成长,核心骨干带教支持,晋升通道畅通。
商品基础算法团队是淘天集团核心的商品理解中台,负责对淘天全域(淘宝、天猫等)数百亿的商品进行深度、精准、多维度的内容理解。我们产出的商品认知能力(如属性、卖点、风格、品类、知识),是整个淘天搜索、推荐、广告、AIGC应用、智能导购、直播等所有核心业务的基石,直接决定了用户“逛”和“买”的体验,是连接“人”与“货”的智能引擎。 当前,我们正处在用新一代AI技术(大模型、多模态大模型)彻底重塑商品世界的历史机遇期。在这里,你将接触到全球最丰富、最复杂的电商多模态数据,有机会定义下一代商品理解的技术范式,你的工作成果将通过集团各大业务场景,影响亿万用户的消费决策。 岗位职责: 1. 构建业界领先的商品多模态理解体系: 负责利用大语言模型(LLM)及视觉语言模型(VLM)等前沿技术,对商品的多模态内容(文本标题、详情描述、图片、视频等)进行深度解析,完成高质量的标签抽取、卖点挖掘、风格识别、需求理解等核心任务。 2. 探索大模型背景下的下一代商品知识库的构建范式:如何从海量商品信息、用户评论、行业知识中自动化构建知识体系?如何解决知识的事实性问题?如何在庞大、有噪声的知识库中抽取有效知识,用于下游落地和应用 3. 负责大模型/多模态模型的前沿技术探索与落地: 跟踪并实践领域内前沿的模型和技术(如模型Fine-tuning, RAG, In-Context Learning, Agent, Model Distillation等),结合业务场景进行技术选型、方案设计与模型优化,解决从训练到部署全链路的挑战,实现技术创新与业务效果的双赢。 4. 设计和优化算法架构与系统: 负责商品理解算法系统的整体架构设计与持续迭代,保证系统的高性能、高可用和高扩展性,以应对淘天集团海量数据的挑战。 5. 驱动技术创新转化为业务价值: 深入理解业务,主动挖掘技术能创造价值的场景,与产品、工程团队紧密协作,通过严谨的AB实验验证算法效果,用技术力量持续驱动业务指标增长。
团队介绍:生活服务业务依托于抖音、抖音极速版等平台,致力于促进用户与本地服务的连接。过去一年,生活服务业务开创了全新的视频种草和交易体验,让更多用户通过抖音发现线下好去处,也帮助众多本地商家拓展了新的经营阵地。我们期待你的加入,一同为亿万用户创造更美好的生活。 课题介绍:生活服务行业在数字化转型中面临效率提升和成本优化的迫切需求,传统商家依赖销售老师处理商品管理、订单咨询、营销推广等环节,存在响应速度慢、标准化程度低、人力成本高等痛点。基于大语言模型(LLM)的对话系统具备自然语言理解、多任务处理、知识推理等能力,可以为商家提供智能客服、流程自动化、数据分析等场景的解决方案。然而,现有通用模型在垂直领域应用中仍存在领域知识匮乏、复杂任务执行能力不足、多模态交互受限等问题,需结合RAG、Function Calling、多模态等技术进行针对性优化。 课题挑战/必要性: 生活服务行业规则多变(如季节性促销、政策调整),需设计低延迟的领域知识库动态更新机制。另外,商家需求多样,对Agent工具调用、动态规划与异常处理能力提出了很高的要求。同时,在交互中期望能够实现语音、图像、文本等多模态信息的内容理解能力与自然交互,解决语义一致性的难题。 课题内容: 1、RAG在垂直领域的优化:构建生活服务行业知识图谱与动态检索库,研究检索增强生成中的上下文压缩技术与深度思考技术,提升答案准确性; 2、Function Calling与业务流程自动化:设计面向商家的工具库,支持自然语言指令到工具调用的精准映射,研究强化学习(RL)在工具调用领域的应用提升模型对领域外工具的识别泛化能力; 3、对话Agent的决策与协作能力:研究基于强化学习(RL)优化Agent的任务规划能力,研究多Agent协作机制; 4、多模态交互与生成:深入研究图像内容理解,开发能够与商家自然沟通的多模态交互与生成系统。