夸克千问事业部-千问大模型Agentic算法专家-北京/杭州

社招全职2年以上技术类-算法2026-06-09地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 拥有计算机科学、人工智能或相关领域的博士学位者优先，硕士学位亦可。
2. 至少 3 年在自然语言处理(NLP)或大语言模型(LLM)领域的研发经验，对 LLM-based Agent、工具使用、强化学习等有深刻的理解和丰富的实战经验。在学术界或工业界有公认的 agentic 或相关技术成果。
3. 在以下一个或多个领域拥有一流的技术水准和成功经验：agent 架构与规划、工具学习与 function calling、大模型对齐技术(SFT/RLHF/RLAIF/DPO/GRPO 等)在 agentic 场景的深度应用、agentic RL、长 horizon 任务的训练与优化、熟…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

全面负责定义、设计并实现下一代 Agentic AI 系统的核心算法与技术范式，将千问从回答问题升级成执行任务，解决智能体在任务规划、工具使用、多步推理、长程自主执行、环境交互等方面的核心挑战，探索并引领模型在自主决策、复杂任务编排、人机协作等前沿方向的技术突破。直接决定数亿千问用户在 AI 助手场景下的任务完成体验, 打造千问在 Agentic AI 时代的领先地位。
1. Agentic 能力定义与技术规划
深入分析用户的真实任务需求与使用场景，结合业务，制定并执行 Agentic 能力的中长期技术演进路线图。密切追踪并研究 agentic AI 领域的最新进展,包括 agent 架构范式(ReAct、多智能体协作等)、agentic RL、工具学习、计算机使用(computer use)、长程自主执行等方向，主导定义“顶级智能体能力”的标准,并将其分解为可落地、可量化的算法迭代目标。
2. 任务规划与多步推理
攻坚并解决复杂任务下的核心技术难题，包括但不限于任务分解与规划、多步推理与反思、错误自我识别与纠正、长程任务的记忆与状态管理、异常处理与恢复等。设计创新的脚手架与训练策略,使模型具备真正可靠、连贯的长程自主执行能力，而不仅是单轮的指令响应。
3. 工具使用与环境交互
主导研发模型与外部工具、API、代码执行环境、搜索引擎、数据库等深度动态融合的先进技术。解决工具调用准确性、参数生成、多工具编排、observation 理解与处理、执行结果验证等核心问题。设计并优化可扩展的工具调用框架与执行环境，显著提升智能体在真实场景下完成复杂任务的成功率与可靠性。
4. Agentic 训练与对齐
主导大模型在 agentic 场景下的 post-training 与对齐工作,包括 agentic SFT、面向工具使用与多步任务的强化学习(RLHF/RLAIF/DPO/GRPO 等)、奖励设计与可验证奖励、长程任务的信用分配、reward hacking 的识别与对抗等，设计高效的样本构建流水线，推动 agentic 能力的持续提升。
5. 评测体系与数据飞轮
建立并完善一套科学、全面的 agentic 能力评测体系，能够精准衡量智能体的任务完成质量(成功率、效率、可靠性、安全性等)，覆盖过程评估与结果评估。探索 Agent-as-Judge 等前沿评测方法，以及针对性agentic benchmark建设，设计并驱动高效的数据闭环系统，利用真实用户的任务轨迹与反馈，持续、自动化地优化模型。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

NLP+

大模型+

AI agent+

强化学习+

SFT+

还有更多 •••

登录查看完整学习资料

相关职位

千问事业部-AI Ops研发专家-运维智能体方向

社招3年以上技术类-开发

1.负责基于 LLM 和 Agent 框架（如 LangGraph, CrewAI, AutoGPT 等）设计并实现 SRE 智能体，构建具备感知、推理、规划、执行与反思能力的闭环运维系统； 2.深度拆解故障排查、容量规划、性能调优等运维场景，利用大模型重构工作流，实现从异常检测、根因分析到故障自愈的端到端自动化； 3.负责构建运维领域专业知识库，优化 RAG链路，提升 Agent 在处理复杂领域问题时的准确性和专业度； 4.探索多 Agent 协同机制，设计并实现针对复杂运维任务的任务分发、角色协作与共识协议； 5.持续优化智能运维平台的性能与扩展性，确保在高并发、超大算力规模环境下 AI 决策的实时性与稳定性。

更新于 2026-04-06杭州|广州

千问事业部-千问/夸克-Post-Training 高级算法专家-北京/杭州

社招3年以上技术类-算法

岗位描述：全面负责千问大模型在 Post-Training 能力进化和上限突破、持续推进模型能力边界和商业价值的不断延伸。通过对前沿算法的极致探索和高效能工程体系的构建，驱动模型在逻辑推理、问答、复杂多轮上下文、指令遵循、Agent 智能体、多模态交互等关键领域实现突破性进展，打造世界一流的模型效果，并定义其在未来 AI 应用中的核心价值。工作职责： ● 【战略规划与技术引领】制定并执行大模型 Post-training 的中长期技术路线图，预判并布局下一代对齐技术、能力增强及对齐方案。主导核心算法的战略方向，确保技术路径与公司业务战略高度协同。 ● 【核心能力与壁垒构建】领导团队进行体系化的数据驱动实验，不仅局限于日常迭代，更要建立可规模化的能力提升范式。您将攻坚并解决模型在复杂指令遵循、通用问答、RAG、深度逻辑推理、内容创作、Tool-Using 等方面的瓶颈问题，构建技术壁垒。 ● 【前沿算法研究与创新】深入探索并推动 Post-training 领域的前沿算法创新，包括但不限于 RLHF/RLAIF 的新范式、模型融合 (Model Fusion/Merge) 、模型蒸馏及 MoE 模型的高效对齐策略。您的目标是显著降低模型幻觉、提升推理的效果、加强模型复杂指令的遵循能力。 ● 【多模态与未来探索】从统一多模态模型的战略视角出发，您将指导并规划多模态统一大模型的 Post-training 技术融合。探索并落地高效的多模态 SFT 数据构建、跨模态能力协同训练及对齐策略，确保模型在图文问答、视频对话等复杂场景下实现无缝、精准的理解与生成。 ● 【团队领导与效能提升】负责 Post-training 算法团队的组建、培养与管理，打造一支具备高效执行力和持续创新能力的顶尖团队。您将指导并优化从研究、实验、评测到部署的全链路工具链与工程框架，实现研发效能的倍增。

更新于 2026-06-08北京|杭州

千问事业部-千问/夸克-大模型高级算法专家-Chat方向

社招3年以上技术类-算法

全面负责定义、设计并实现下一代对话系统的核心算法与交互范式，解决当前对话模型在多轮交互、知识应用、共情能力等方面的挑战，探索并引领模型在个性化、主动性、拟人化等前沿方向的技术突破。直接决定数亿夸克用户在Chat场景的与AI 的交互体验，塑造夸克在未来对话式 AI 时代的领先地位。 1. 对话体验定义与规划。深入分析用户意图与行为，结合业务场景，制定并执行对话体验的中长期技术演进路线图。并密切追踪并研究对话式 AI 领域的最新进展，包括主动式对话策略、多模态对话 (语音/视觉融合)、AI Agent 中的对话流控制等。您将主导定义“顶级对话体验”的标准，并将其分解为可落地、可量化的算法迭代目标。 2. 多轮对话与上下文理解。攻坚并解决长程、复杂多轮对话中的核心技术难题，包括但不限于指令遵循、上下文精准理解、长程记忆与遗忘机制、隐式意图识别等。您将设计创新的模型结构与训练策略，使模型具备真正连贯、有逻辑的对话能力。 3. 对话回复准确与全面。主导研发将外部知识 (如搜索、工具调用) 与大模型进行深度、动态融合的先进技术。致力于解决模型在对话中的意图偏离、事实性错误、内容不详实和知识更新不及时等问题，并通过 RAG 新范式或其他创新方法，显著提升对话的准确性与信息量。 4. 评测体系与数据飞轮。建立并完善一套科学、全面的对话能力评测体系，能够精准衡量模型的综合对话质量 (Coherence, Empathy, Informativeness 等)。设计并驱动高效的数据闭环系统，利用真实用户反馈持续、自动化地优化模型。

更新于 2026-06-05北京|杭州

千问事业部-大模型训练优化专家-杭州/广州/北京

社招3年以上

1、参与万卡大规模文本及多模态大模型训练框架建设，为Quark、通义等国民级APP的大模型提供持续效果优化能力； 2、参与算法与工程结合的模型结构创新设计，并通过工程实现验证模型性能和训练效率； 3、参与万卡规模训练任务的极致训练效率优化，负责前沿技术的调研、引入和创新，效果验证与落地等工作。

更新于 2026-06-05杭州|广州|北京