通义通义实验室-算法专家-Multi-Agent
任职要求
1、 硕士以上学历,在以下方向至少有一年的科研或工作经历:自然语言处理、多智能体系统、搜索推荐广告等大规模机器学习应用、强化学习应用、机器学…
工作职责
团队介绍: 通义实验室-智能计算实验室-智能系统研究组,致力于机器学习、机制设计、数据处理与数据库等学科技术的研究和落地,有完善的产学研结构,算法研究与业务创新并重。团队成员皆毕业于国内外知名高校。团队过去几年在机器学习、数据库等领域顶级会议发表论文近百篇,并曾获SIGKDD 2022最佳论文奖。当前团队致力于大语言模型领域的高质量数据生产与行业应用创新,诚邀各路英才加盟。 职位描述: 团队主要聚焦于大语言模型(LLM)技术,我们期待你的工作覆盖一下至少一个技术方向: 1、LLM预训练数据的生产,包括高效数据清洗、高质量问答或者COT数据的生成等新兴方向。 2、RLHF微调技术:根据设定的alignment调优目标,探索并应用RLHF类算法。 3、Multi-agents协作系统:以LLM agents应用后链路处理工具,打造多智能系统以及相关应用。 4、LLM工程链路及优化:Megatron框架、数据处理框架、推理部署等。 5、LLM行业应用:结合行业属性,收集数据并设计算法,深度探索LLM在垂类下的优化空间。 6、LLM中的机器学习理论:针对LLM全链路的各类算法各类算子以及分布式框架,探索相应的优化理论。 工作内容: 1、 前沿技术研究:在以上技术方向上,寻找有价值的科研问题,在算法、系统、理论等方向开展前沿研究工作,发表高质量有影响力的论文及专利,并对业务产生积极作用。 2、 业务创新与落地:结合行业大模型领域的核心客户需求,设计并完善行业大模型相关技术框架,并持续优化迭代,为行业线提供有创新性的各类算法解决方案。
1、核心算法研发:主导Agentic RL及多智能体(Multi-Agent)算法的研发,融合大模型和多模态(LLM/VLM)的推理能力。 2、训练框架优化:负责RL训练框架的性能调优与迭代,提升大规模训练效率。 3、智能体构建与落地:构建面向真实场景的智能体,包括但不限于GUI Agent、代码Agent、根因分析(RCA)Agent等,驱动业务创新。
团队介绍: 数字支付智能技术团队,专注于支持支付业务的增长(包括线下支付和线上支付)。该职位主要聚焦于支持线下“碰一下”的支付和数字化业务场景,涵盖支付C端增长和支付B端增长,通过算法应用帮助业务提升效率并贡献增量价值,共同创造新的“碰一下”创新赛道。 职位描述: 大模型技术研发与场景落地基于大模型构建支付场景智能化解决方案(营销策略生成、Multi-Agent协作系统、RAG知识问答等)开发面向支付业务的领域大模型,优化模型推理效率与场景泛化能力
我们正在重新定义“千问”:从一个博学的对话者进化为具备执行力的数字实体。我们的核心使命是构建一套统一的认知架构,打破模型与现实世界的壁垒。通过 Skill-based Agent 技术,实现从“语义理解”到“任务闭环”的跨越,让 AI 真正深入生产力场景,实现数字世界与物理世界的高效连接 1. 统一认知架构设计与能力演进: - 深度对接阿里集团内部及外部第三方服务,设计并实现高效、稳定的 Agent 框架。负责将复杂的业务逻辑抽象为可插拔的配置、标准化的工具,供大模型理解与调用。 - 设计 skill-based 【统一Agent】架构,实现长程规划与自我反思能力的统一认知架构,以协调内部的推理、记忆和执行模块,实现统一智能体在跨场景、长链条任务上的优异表现。 - 推动并构建一个动态的“千问能办” skill library,将海量、异构的原子能力抽象为该统一智能体可学习、可组合、可泛化的skill,探索自动化技能发现与组合优化的前沿方法。 2. 核心场景算法优化: ⁃长程规划与决策优化: 针对复杂复合需求,研发先进的任务分解与多步推理算法,解决长链条执行中的错误积累与漂移问题。 -Agentic-RL 策略: 构建基于 环境反馈的强化学习(RLHB/RLAIF) 体系,通过在模拟环境中的大规模探索,提升 Agent 在极端场景下的鲁棒性与决策上限。 -领域知识注入: 针对高频场景(学习、办公、生活)进行长程预训练与持续学习,让 Agent 不仅拥有通用逻辑,更具备深度的行业专家意识。 3. 实际需求驱动迭代: - 建立科学、全面的Agent评测体系,通过线上数据分析、Bad Case挖掘,精准定位模型在幻觉、误拒答、组合泛化、执行失败等方面的瓶颈。 - 领导数据驱动的迭代飞轮,不仅是利用线上反馈进行微调,更要探索世界模型模拟、合成数据生成、以及基于AI反馈的强化学习等手段,高效、规模化地提升统一智能体的能力上限。

我们正在重新定义“千问”:从一个博学的对话者进化为具备执行力的数字实体。我们的核心使命是构建一套统一的认知架构,打破模型与现实世界的壁垒。通过 Skill-based Agent 技术,实现从“语义理解”到“任务闭环”的跨越,让 AI 真正深入生产力场景,实现数字世界与物理世界的高效连接 1. 统一认知架构设计与能力演进: - 深度对接阿里集团内部及外部第三方服务,设计并实现高效、稳定的 Agent 框架。负责将复杂的业务逻辑抽象为可插拔的配置、标准化的工具,供大模型理解与调用。 - 设计 skill-based 【统一Agent】架构,实现长程规划与自我反思能力的统一认知架构,以协调内部的推理、记忆和执行模块,实现统一智能体在跨场景、长链条任务上的优异表现。 - 推动并构建一个动态的“千问能办” skill library,将海量、异构的原子能力抽象为该统一智能体可学习、可组合、可泛化的skill,探索自动化技能发现与组合优化的前沿方法。 2. 核心场景算法优化: ⁃长程规划与决策优化: 针对复杂复合需求,研发先进的任务分解与多步推理算法,解决长链条执行中的错误积累与漂移问题。 -Agentic-RL 策略: 构建基于 环境反馈的强化学习(RLHB/RLAIF) 体系,通过在模拟环境中的大规模探索,提升 Agent 在极端场景下的鲁棒性与决策上限。 -领域知识注入: 针对高频场景(学习、办公、生活)进行长程预训练与持续学习,让 Agent 不仅拥有通用逻辑,更具备深度的行业专家意识。 3. 实际需求驱动迭代: - 建立科学、全面的Agent评测体系,通过线上数据分析、Bad Case挖掘,精准定位模型在幻觉、误拒答、组合泛化、执行失败等方面的瓶颈。 - 领导数据驱动的迭代飞轮,不仅是利用线上反馈进行微调,更要探索世界模型模拟、合成数据生成、以及基于AI反馈的强化学习等手段,高效、规模化地提升统一智能体的能力上限。