logo of quark

夸克千问C端事业群-大模型Agent算法专家(生态合作与智能协议)-杭州/北京

社招全职2年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1、深厚的大模型研发经验:熟悉主流大模型(如Qwen、GLM系列)的原理、微调技术及分布式训练框架,精通 Agent/RAG 架构,有从零构建 Skill-based 系统或大型 Multi-Agent 协作系统的落地经验…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


我们正在重新定义“千问”:从一个博学的对话者进化为具备执行力的数字实体。我们的核心使命是构建一套统一的认知架构,打破模型与现实世界的壁垒。通过 Skill-based Agent 技术,实现从“语义理解”到“任务闭环”的跨越,让 AI 真正深入生产力场景,实现数字世界与物理世界的高效连接

1. 统一认知架构设计与能力演进:
    - 深度对接阿里集团内部及外部第三方服务,设计并实现高效、稳定的 Agent 框架。负责将复杂的业务逻辑抽象为可插拔的配置、标准化的工具,供大模型理解与调用。
    - 设计 skill-based 【统一Agent】架构,实现长程规划与自我反思能力的统一认知架构,以协调内部的推理、记忆和执行模块,实现统一智能体在跨场景、长链条任务上的优异表现。
    - 推动并构建一个动态的“千问能办” skill library,将海量、异构的原子能力抽象为该统一智能体可学习、可组合、可泛化的skill,探索自动化技能发现与组合优化的前沿方法。

2.  核心场景算法优化:
    ⁃长程规划与决策优化: 针对复杂复合需求,研发先进的任务分解与多步推理算法,解决长链条执行中的错误积累与漂移问题。
    -Agentic-RL 策略: 构建基于 环境反馈的强化学习(RLHB/RLAIF) 体系,通过在模拟环境中的大规模探索,提升 Agent 在极端场景下的鲁棒性与决策上限。
    -领域知识注入: 针对高频场景(学习、办公、生活)进行长程预训练与持续学习,让 Agent 不仅拥有通用逻辑,更具备深度的行业专家意识。

3. 实际需求驱动迭代:
    - 建立科学、全面的Agent评测体系,通过线上数据分析、Bad Case挖掘,精准定位模型在幻觉、误拒答、组合泛化、执行失败等方面的瓶颈。
    - 领导数据驱动的迭代飞轮,不仅是利用线上反馈进行微调,更要探索世界模型模拟、合成数据生成、以及基于AI反馈的强化学习等手段,高效、规模化地提升统一智能体的能力上限。
包括英文材料
大模型+
AI agent+
RAG+
还有更多 •••
相关职位

logo of aligenie
社招2年以上技术类-算法

我们正在重新定义“千问”:从一个博学的对话者进化为具备执行力的数字实体。我们的核心使命是构建一套统一的认知架构,打破模型与现实世界的壁垒。通过 Skill-based Agent 技术,实现从“语义理解”到“任务闭环”的跨越,让 AI 真正深入生产力场景,实现数字世界与物理世界的高效连接 1. 统一认知架构设计与能力演进: - 深度对接阿里集团内部及外部第三方服务,设计并实现高效、稳定的 Agent 框架。负责将复杂的业务逻辑抽象为可插拔的配置、标准化的工具,供大模型理解与调用。 - 设计 skill-based 【统一Agent】架构,实现长程规划与自我反思能力的统一认知架构,以协调内部的推理、记忆和执行模块,实现统一智能体在跨场景、长链条任务上的优异表现。 - 推动并构建一个动态的“千问能办” skill library,将海量、异构的原子能力抽象为该统一智能体可学习、可组合、可泛化的skill,探索自动化技能发现与组合优化的前沿方法。 2. 核心场景算法优化: ⁃长程规划与决策优化: 针对复杂复合需求,研发先进的任务分解与多步推理算法,解决长链条执行中的错误积累与漂移问题。 -Agentic-RL 策略: 构建基于 环境反馈的强化学习(RLHB/RLAIF) 体系,通过在模拟环境中的大规模探索,提升 Agent 在极端场景下的鲁棒性与决策上限。 -领域知识注入: 针对高频场景(学习、办公、生活)进行长程预训练与持续学习,让 Agent 不仅拥有通用逻辑,更具备深度的行业专家意识。 3. 实际需求驱动迭代: - 建立科学、全面的Agent评测体系,通过线上数据分析、Bad Case挖掘,精准定位模型在幻觉、误拒答、组合泛化、执行失败等方面的瓶颈。 - 领导数据驱动的迭代飞轮,不仅是利用线上反馈进行微调,更要探索世界模型模拟、合成数据生成、以及基于AI反馈的强化学习等手段,高效、规模化地提升统一智能体的能力上限。

更新于 2026-03-31北京|杭州
logo of quark
社招1年以上技术类-算法

1. 跟进大模型的前沿进展,负责大模型在百亿级流量搜索和信息流广告客户侧的应用和优化; 2. 跟进和研究前沿AI Agent技术,负责效果广告系统AI Assistant、投放AI Agent的研究和落地; 3. 构建商业Agent生态基础技术平台能力,包括Prompt、RAG、LLMs(预训练、微调、RLHF等)、数据、评测、agent框架等;

更新于 2026-03-26北京
logo of quark
社招2年以上技术类-算法

1. 负责多模态内容安全防控体系搭建,建设多全模态内容审核能力、多模态大模型安全调优能力,保证业务安全及大模型应用安全; 2. 多模态大模型算法:参与多模态大模型安全能力建设,负责多模态大模型安全能力、跨模态通用表征、AI Agent、AIGC等算法研发与应用,建立端到端多模态安全风控解决方案,紧跟业界前沿研究方向; 3、岗位特色:应对全风险,全模态问题,快速提升综合算法能力,与大模型时代发展同步,深耕大模型安全领域,持续积累安全领域业务经验; 4、业务支持:保障夸克AI、通义千问ToC、UC浏览器、书旗小说、超级汇川等产品的内容安全及大模型安全; 5、部门特色:作为综合型安全中台,包含法务、GA、公关、数安、内安、商安等职能,协同共建为业务提供全面安全保障。

更新于 2026-02-10北京
logo of quark
社招3年以上技术类-算法

岗位描述: 全面负责千问大模型在 Post-Training 能力进化和上限突破、持续推进模型能力边界和商业价值的不断延伸。通过对前沿算法的极致探索和高效能工程体系的构建,驱动模型在逻辑推理、问答、复杂多轮上下文、指令遵循、Agent 智能体、多模态交互等关键领域实现突破性进展,打造世界一流的模型效果,并定义其在未来 AI 应用中的核心价值。 工作职责: ● 【战略规划与技术引领】 制定并执行大模型 Post-training 的中长期技术路线图,预判并布局下一代对齐技术、能力增强及对齐方案。主导核心算法的战略方向,确保技术路径与公司业务战略高度协同。 ● 【核心能力与壁垒构建】 领导团队进行体系化的数据驱动实验,不仅局限于日常迭代,更要建立可规模化的能力提升范式。您将攻坚并解决模型在复杂指令遵循、通用问答、RAG、深度逻辑推理、内容创作、Tool-Using 等方面的瓶颈问题,构建技术壁垒。 ● 【前沿算法研究与创新】 深入探索并推动 Post-training 领域的前沿算法创新,包括但不限于 RLHF/RLAIF 的新范式、模型融合 (Model Fusion/Merge) 、模型蒸馏及 MoE 模型的高效对齐策略。您的目标是显著降低模型幻觉、提升推理的效果、加强模型复杂指令的遵循能力。 ● 【多模态与未来探索】 从统一多模态模型的战略视角出发,您将指导并规划多模态统一大模型的 Post-training 技术融合。探索并落地高效的多模态 SFT 数据构建、跨模态能力协同训练及对齐策略,确保模型在图文问答、视频对话 等复杂场景下实现无缝、精准的理解与生成。 ● 【团队领导与效能提升】 负责 Post-training 算法团队的组建、培养与管理,打造一支具备高效执行力和持续创新能力的顶尖团队。您将指导并优化从研究、实验、评测到部署的全链路工具链与工程框架,实现研发效能的倍增。

更新于 2026-04-07北京|杭州