千问千问事业部-千问/夸克-大模型强化学习专家-前沿技术攻坚

社招全职3年以上技术类-算法2026-07-21地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 硕士及以上学历，数学、强化学习、自然语言处理等相关专业；
2. 在强化学习方面具有丰富的专业知识，熟练掌握深度强化学习算法在大语言模型中的应用及前沿知识；
3. 熟悉大模型相关深度学习框架，如Transformers、PyTorch、Megatron-LM等，有扎实的编程基础和代码实现能力；
4. 具备良好的沟通、…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

通过强化学习提升万亿级参数大模型的决策认知能力，实现大模型在复杂环境下的多模态交互，完成多轮感知-决策闭环，在前沿实践中推动AGI落地；
研发新一代大模型强化学习算法，提升大模型在多模态、工具调用、复杂环境交互、多智能体交互等方向的基础能力；
改进大规模分布式强化学习框架，优化万卡集群下的高效分布式训练效率，支持大模型与复杂环境/工具的高效交互；
将强化学习研究成果融入千问&夸克产品生态，打造更懂用户的智能服务产品, 让前沿技术惠及亿万用户。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

强化学习+

NLP+

算法+

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

千问C端事业群-千问/夸克-大模型高级算法专家-Chat方向

社招3年以上技术类-算法

全面负责定义、设计并实现下一代对话系统的核心算法与交互范式，解决当前对话模型在多轮交互、知识应用、共情能力等方面的挑战，探索并引领模型在个性化、主动性、拟人化等前沿方向的技术突破。直接决定数亿夸克用户在Chat场景的与AI 的交互体验，塑造夸克在未来对话式 AI 时代的领先地位。 1. 对话体验定义与规划。深入分析用户意图与行为，结合业务场景，制定并执行对话体验的中长期技术演进路线图。并密切追踪并研究对话式 AI 领域的最新进展，包括主动式对话策略、多模态对话 (语音/视觉融合)、AI Agent 中的对话流控制等。您将主导定义“顶级对话体验”的标准，并将其分解为可落地、可量化的算法迭代目标。 2. 多轮对话与上下文理解。攻坚并解决长程、复杂多轮对话中的核心技术难题，包括但不限于指令遵循、上下文精准理解、长程记忆与遗忘机制、隐式意图识别等。您将设计创新的模型结构与训练策略，使模型具备真正连贯、有逻辑的对话能力。 3. 对话回复准确与全面。主导研发将外部知识 (如搜索、工具调用) 与大模型进行深度、动态融合的先进技术。致力于解决模型在对话中的意图偏离、事实性错误、内容不详实和知识更新不及时等问题，并通过 RAG 新范式或其他创新方法，显著提升对话的准确性与信息量。 4. 评测体系与数据飞轮。建立并完善一套科学、全面的对话能力评测体系，能够精准衡量模型的综合对话质量 (Coherence, Empathy, Informativeness 等)。设计并驱动高效的数据闭环系统，利用真实用户反馈持续、自动化地优化模型。

更新于 2026-04-01北京|杭州

千问C端事业群-千问/夸克-大模型预训练与应用算法工程师-杭州/北京

社招2年以上技术类-算法

1. 操控万卡规模的 GPU 集群，对超大参数量级的预训练模型进行高效分布式训练与优化。 2.深度参与多模态（图像、语音、文本、视频）大模型的研发，探索多学科交叉领域的新奇玩法。 3.我们的技术将为千问和夸克的亿万用户提供高品质的AI智能服务，见证前沿技术实现真正的用户价值加入我们，你将获得： 1.与顶级专家携手，以世界级算力资源和数据支持为背书，不断挑战技术极限。 2.极具竞争力的薪酬与福利，人性化、追求卓越技术的的工程师团队文化，助你在职业成长道路上全速前进。 3.在通往 AGI 的征途上，亲历关键技术的诞生与应用，留下属于你的时代印记。如果你渴望驰骋在大模型与 AGI 的蓝海之中，那么这将是你的最佳舞台！快来加入我们，一同开创智能时代的新纪元。

更新于 2026-03-30北京|杭州

千问事业部-千问/夸克-语音AI产品经理-杭州/北京

社招3年以上产品类-用户型

● 语音核心体验提升负责语音基础能力在产品内的体验升级（语音输入、播报、搜索、实时通话等），定制优化策略，推动语音功能使用率、留存、转化的数据指标提升，推动产品内用户语音心智建立 ● 语音交互产品功能优化负责语音交互相关的产品功能设计和落地，深入挖掘用户需求，设计产品方案和优化策略，驱动产品迭代；能独立提出需求并推动产品和研发落地，确保体验和指标提升。 ● 推动语音模型效果提升负责 ASR、TTS、E2E、多模态模型的用户侧效果验证机制搭建，与算法团队合作，结合产品需求，拆解合理的算法评价指标，搭建评测体系，推动算法快速迭代

更新于 2026-06-18北京|杭州

千问事业部-千问/夸克-Post-Training 高级算法专家-北京/杭州

社招3年以上技术类-算法

岗位描述：全面负责千问大模型在 Post-Training 能力进化和上限突破、持续推进模型能力边界和商业价值的不断延伸。通过对前沿算法的极致探索和高效能工程体系的构建，驱动模型在逻辑推理、问答、复杂多轮上下文、指令遵循、Agent 智能体、多模态交互等关键领域实现突破性进展，打造世界一流的模型效果，并定义其在未来 AI 应用中的核心价值。工作职责： ● 【战略规划与技术引领】制定并执行大模型 Post-training 的中长期技术路线图，预判并布局下一代对齐技术、能力增强及对齐方案。主导核心算法的战略方向，确保技术路径与公司业务战略高度协同。 ● 【核心能力与壁垒构建】领导团队进行体系化的数据驱动实验，不仅局限于日常迭代，更要建立可规模化的能力提升范式。您将攻坚并解决模型在复杂指令遵循、通用问答、RAG、深度逻辑推理、内容创作、Tool-Using 等方面的瓶颈问题，构建技术壁垒。 ● 【前沿算法研究与创新】深入探索并推动 Post-training 领域的前沿算法创新，包括但不限于 RLHF/RLAIF 的新范式、模型融合 (Model Fusion/Merge) 、模型蒸馏及 MoE 模型的高效对齐策略。您的目标是显著降低模型幻觉、提升推理的效果、加强模型复杂指令的遵循能力。 ● 【多模态与未来探索】从统一多模态模型的战略视角出发，您将指导并规划多模态统一大模型的 Post-training 技术融合。探索并落地高效的多模态 SFT 数据构建、跨模态能力协同训练及对齐策略，确保模型在图文问答、视频对话等复杂场景下实现无缝、精准的理解与生成。 ● 【团队领导与效能提升】负责 Post-training 算法团队的组建、培养与管理，打造一支具备高效执行力和持续创新能力的顶尖团队。您将指导并优化从研究、实验、评测到部署的全链路工具链与工程框架，实现研发效能的倍增。

更新于 2026-07-14北京|杭州