京东基于(自动化)大语言模型在商品理解任务中的应用
任职要求
1、获得本科及以上学历,计算机、人工智能、自动化、数学、物理等相关专业;系统化的机器学习基础素养,有深刻的、问题驱动式的模型训练与调试能力; 2、NLP/CV/大模型基础知识扎实,熟悉或能快速上手…
工作职责
1、负责研发具备领域属性识别、商品匹配与商品分类等多任务能力的大模型; 2、研发LLM-as-a-Judge用于自动化评测,设计human-in-the-loop的校验机制,提高组内各方向例行评测效率与可信度; 3、研发与应用商品理解宪法,结合RAG、多Agentsdebate等方式,提升自研或外部LLM的商品理解效果; 4、探索多模态大模型对商品详情页甚至站点web页互连子图的理解能力(商详页包含文字、图片、半结构化信息,超链接等);
我们是一支充满活力与技术深度的自营行业算法团队,致力于驱动天猫超市、天猫国际等核心自营业务的智能化升级。在这里,我们不仅用数据理解消费趋势,更用算法重塑商品运营与客户服务——从“人工经验驱动”到“AI自主决策”,构建更具竞争力的商品供给与更高效、可规模化的智能服务体系。 我们积极拥抱生成式AI浪潮,已在多个关键场景实现落地突破: ● 商品侧:探索基于大模型的智能选品辅助、营销素材生成与合规性机审,提升商品上架效率与内容质量; ● 客服侧:构建支持多轮意图识别、任务规划与跨系统调用的智能客服Agent,实现从“问答匹配”到“问题解决”的跃迁。 当前,我们正打造以大模型为认知核心、Agent为执行载体的下一代智能体系统,覆盖商品全生命周期管理与用户服务闭环。加入我们,你将参与设计并落地真正意义上的AI原生电商引擎,推动业务进入自动化、可进化的新阶段。 岗位描述: 1. 负责大模型后训练与领域适配,参与通用大模型在自营场景下的微调、指令对齐与多轮对话优化,提升模型在商品问答、素材生成、客服应答等任务中的专业性与一致性。 2. 负责智能Agent体系的研发与落地,涵盖工具调用(Tool Use)、任务规划、状态管理与多Agent协作机制,实现在智能选品、客服QA等复杂场景中的端到端闭环执行。 3. 负责设计并优化检索增强(RAG)系统,从索引构建、召回排序到知识融合与上下文压缩,全面提升RAG在商品知识、营销信息、服务标准等高准确性需求场景下的效果与稳定性。 4. 负责建立科学评测体系,设计覆盖功能性、合规性、一致性与业务转化的多维评估指标,系统分析模型表现,指导模型与Agent策略的精准优化。 5. 推进前沿技术在业务中的验证与落地,深入跟踪 LLM领域前沿进展,在真实场景中快速实验并应用。 6. 协同产品与工程团队,将算法能力高效集成至线上系统,兼顾性能、延迟与可用性,确保用户体验与业务目标双达成。 我们能提供: 1. 高价值业务场景:深耕天猫超市、天猫国际的商品与客服体系,覆盖跨境选品、用户咨询、履约售后等完整链路,技术直击业务核心。 2. 快速闭环验证:依托自营决策权,算法可快速上线并反馈于转化率、响应准确率、人力替代率等核心指标。 3. 丰富数据与资源支持:拥有完整的商品知识库、用户行为流与客服对话日志,支撑高质量训练与评测。 4. 复合成长路径:在技术深度(大模型/Agent)与业务广度(电商/跨境/客服)双重挑战中成长,核心骨干带教支持,晋升通道畅通。

我们是一支充满活力与技术深度的自营行业算法团队,致力于驱动天猫超市、天猫国际等核心自营业务的智能化升级。在这里,我们不仅用数据理解消费趋势,更用算法重塑商品运营与客户服务——从“人工经验驱动”到“AI自主决策”,构建更具竞争力的商品供给与更高效、可规模化的智能服务体系。 我们积极拥抱生成式AI浪潮,已在多个关键场景实现落地突破: ● 商品侧:探索基于大模型的智能选品辅助、营销素材生成与合规性机审,提升商品上架效率与内容质量; ● 客服侧:构建支持多轮意图识别、任务规划与跨系统调用的智能客服Agent,实现从“问答匹配”到“问题解决”的跃迁。 当前,我们正打造以大模型为认知核心、Agent为执行载体的下一代智能体系统,覆盖商品全生命周期管理与用户服务闭环。加入我们,你将参与设计并落地真正意义上的AI原生电商引擎,推动业务进入自动化、可进化的新阶段。 岗位描述: 1. 负责大模型后训练与领域适配,参与通用大模型在自营场景下的微调、指令对齐与多轮对话优化,提升模型在商品问答、素材生成、客服应答等任务中的专业性与一致性。 2. 负责智能Agent体系的研发与落地,涵盖工具调用(Tool Use)、任务规划、状态管理与多Agent协作机制,实现在智能选品、客服QA等复杂场景中的端到端闭环执行。 3. 负责设计并优化检索增强(RAG)系统,从索引构建、召回排序到知识融合与上下文压缩,全面提升RAG在商品知识、营销信息、服务标准等高准确性需求场景下的效果与稳定性。 4. 负责建立科学评测体系,设计覆盖功能性、合规性、一致性与业务转化的多维评估指标,系统分析模型表现,指导模型与Agent策略的精准优化。 5. 推进前沿技术在业务中的验证与落地,深入跟踪 LLM领域前沿进展,在真实场景中快速实验并应用。 6. 协同产品与工程团队,将算法能力高效集成至线上系统,兼顾性能、延迟与可用性,确保用户体验与业务目标双达成。 我们能提供: 1. 高价值业务场景:深耕天猫超市、天猫国际的商品与客服体系,覆盖跨境选品、用户咨询、履约售后等完整链路,技术直击业务核心。 2. 快速闭环验证:依托自营决策权,算法可快速上线并反馈于转化率、响应准确率、人力替代率等核心指标。 3. 丰富数据与资源支持:拥有完整的商品知识库、用户行为流与客服对话日志,支撑高质量训练与评测。 4. 复合成长路径:在技术深度(大模型/Agent)与业务广度(电商/跨境/客服)双重挑战中成长,核心骨干带教支持,晋升通道畅通。
团队介绍:Data-电商-平台治理算法团队,通过优化算法,和业务团队协作,对字节旗下的电商产品进行全方位的质量和生态的治理,既包括风险、违规和低质问题的打击,也包括健康电商生态的建设和优化,在最大程度的优化平台治理的效果的同时提升治理的工作效率,降低成本。另外一方面,平台治理算法团队致力于攻坚前沿的AI技术,以技术驱动推动业务的变革和发展,领域涉及广泛,包括但不限于NLP/CV/多模态/大模型/图算法/序列算法等。 课题介绍: 背景:电商智能审核业务比较复杂,随着审核技术的不断演进,各个领域面临着新的风险问题和对抗形式,这对大模型的应用提出了新的挑战。例如,在电商审核业务中,涉及审核PBR变更、长文本、长时序、多语言、少样本和AIGC生成对抗等问题时,现有的开源大模型表现往往不尽人意。因此,针对这些挑战,我们亟需研发专门针对电商智能审核的大模型,以提升其在电商治理中的有效性和适应性。特别的,针对电商业务特点,我们需要探索高质量的数据自动生成、高效的MOE Embedding、Auto-Prompt生成、高质量 COT输出、大模型知识蒸馏等。此外,该模型应能够满足电商审核业务的需求,实现高准确率的自主决策和可解释性的COT生成,显著减少误判。针对动态变化的审核PBR变更,它能够通过RAG模块自动检索类似的审核案例,将复杂的审核PBR分解为简单的原子任务,自动拆分出驳回和豁免原子任务,并自动调用相应的Tools来解决这些任务,从而建立“知道拒绝并且知道为何拒绝”的业内领先智能审核系统。最终,大模型智能审核系统的审核效果需要接近或者超过人工审核,往全机审的路线上演进。 研究方向:模态融合能力:提升文本、音频、图像、视频和直播等多模态的细粒度理解能力,实现高准确率的自主决策和可解释性的COT生成;Few-Shot能力:探索电商多语言、长时序和少样本问题,增强Few-Shot和Zero-Shot能力,针对多变的业务规则具备复杂指令和Auto-Prompt生成能力;攻防对抗能力:研究AIGC图像视频的判别,增强审核大模型对隐晦、抽象的生成式内容的攻防对抗能力;Agent能力:具备调用RAG模块,使用Tools,和Auto-planning能力;提升大模型的动态推理和反思能力。 1、深入理解电商业务,探索基于大模型、多模态模型,持续提升商家/达人在准入、发品、售后等各个业务场景的风险识别效果; 2、提升商品治理审核智能化水平,迭代优化治理大模型,提升大模型对治理规则和商品信息的理解,实现高准高召的问题识别和自动处置; 3、负责强化电商场景下,大模型推理和反思能力,通过商品业务域SFT、高质量Cot、强化学习、数据合成等技术方案,提升商品治理大模型底座能力; 4、参与构建挖掘电商直播、商品、商家和带货主播等多种实体的数据,对大规模网络/海量特征序列进行建模,支撑商家、达人分类/风险团伙挖掘等业务场景解决问题,并为商家/达人治理提供支持; 5、参与构建大规模的图存储和图学习平台,完善电商社区内商家/商品/达人/视频内容的关系建设,构建电商实体通用表征能力,赋能治理业务; 6、建设售后服务MLLM基座大模型,并利用RAG/Agent/RL等技术,解决复杂场景下对体验问题的理解能力。
团队介绍:Data-电商-平台治理算法团队,通过优化算法,和业务团队协作,对字节旗下的电商产品进行全方位的质量和生态的治理,既包括风险、违规和低质问题的打击,也包括健康电商生态的建设和优化,在最大程度的优化平台治理的效果的同时提升治理的工作效率,降低成本。另外一方面,平台治理算法团队致力于攻坚前沿的AI技术,以技术驱动推动业务的变革和发展,领域涉及广泛,包括但不限于NLP/CV/多模态/大模型/图算法/序列算法等。 课题介绍: 背景:电商智能审核业务比较复杂,随着审核技术的不断演进,各个领域面临着新的风险问题和对抗形式,这对大模型的应用提出了新的挑战。例如,在电商审核业务中,涉及审核PBR变更、长文本、长时序、多语言、少样本和AIGC生成对抗等问题时,现有的开源大模型表现往往不尽人意。因此,针对这些挑战,我们亟需研发专门针对电商智能审核的大模型,以提升其在电商治理中的有效性和适应性。特别的,针对电商业务特点,我们需要探索高质量的数据自动生成、高效的MOE Embedding、Auto-Prompt生成、高质量 COT输出、大模型知识蒸馏等。此外,该模型应能够满足电商审核业务的需求,实现高准确率的自主决策和可解释性的COT生成,显著减少误判。针对动态变化的审核PBR变更,它能够通过RAG模块自动检索类似的审核案例,将复杂的审核PBR分解为简单的原子任务,自动拆分出驳回和豁免原子任务,并自动调用相应的Tools来解决这些任务,从而建立“知道拒绝并且知道为何拒绝”的业内领先智能审核系统。最终,大模型智能审核系统的审核效果需要接近或者超过人工审核,往全机审的路线上演进。 研究方向:模态融合能力:提升文本、音频、图像、视频和直播等多模态的细粒度理解能力,实现高准确率的自主决策和可解释性的COT生成;Few-Shot能力:探索电商多语言、长时序和少样本问题,增强Few-Shot和Zero-Shot能力,针对多变的业务规则具备复杂指令和Auto-Prompt生成能力;攻防对抗能力:研究AIGC图像视频的判别,增强审核大模型对隐晦、抽象的生成式内容的攻防对抗能力;Agent能力:具备调用RAG模块,使用Tools,和Auto-planning能力;提升大模型的动态推理和反思能力。 1、深入理解电商业务,探索基于大模型、多模态模型,持续提升商家/达人在准入、发品、售后等各个业务场景的风险识别效果; 2、提升商品治理审核智能化水平,迭代优化治理大模型,提升大模型对治理规则和商品信息的理解,实现高准高召的问题识别和自动处置; 3、负责强化电商场景下,大模型推理和反思能力,通过商品业务域SFT、高质量Cot、强化学习、数据合成等技术方案,提升商品治理大模型底座能力; 4、参与构建挖掘电商直播、商品、商家和带货主播等多种实体的数据,对大规模网络/海量特征序列进行建模,支撑商家、达人分类/风险团伙挖掘等业务场景解决问题,并为商家/达人治理提供支持; 5、参与构建大规模的图存储和图学习平台,完善电商社区内商家/商品/达人/视频内容的关系建设,构建电商实体通用表征能力,赋能治理业务; 6、建设售后服务MLLM基座大模型,并利用RAG/Agent/RL等技术,解决复杂场景下对体验问题的理解能力。