千问千问C端事业群-大模型Agent算法专家（生态合作与智能协议）-杭州/北京

社招全职2年以上技术类-算法2026-03-31地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1、深厚的大模型研发经验：熟悉主流大模型（如Qwen、GLM系列）的原理、微调技术及分布式训练框架，精通 Agent/RAG 架构，有从零构建 Skill-based 系统或大型 Multi-Agent 协作系统的落地经验…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

我们正在重新定义“千问”：从一个博学的对话者进化为具备执行力的数字实体。我们的核心使命是构建一套统一的认知架构，打破模型与现实世界的壁垒。通过 Skill-based Agent 技术，实现从“语义理解”到“任务闭环”的跨越，让 AI 真正深入生产力场景，实现数字世界与物理世界的高效连接

1. 统一认知架构设计与能力演进：
    - 深度对接阿里集团内部及外部第三方服务，设计并实现高效、稳定的 Agent 框架。负责将复杂的业务逻辑抽象为可插拔的配置、标准化的工具，供大模型理解与调用。
    - 设计 skill-based 【统一Agent】架构，实现长程规划与自我反思能力的统一认知架构，以协调内部的推理、记忆和执行模块，实现统一智能体在跨场景、长链条任务上的优异表现。
    - 推动并构建一个动态的“千问能办” skill library，将海量、异构的原子能力抽象为该统一智能体可学习、可组合、可泛化的skill，探索自动化技能发现与组合优化的前沿方法。

2.  核心场景算法优化：
    ⁃长程规划与决策优化： 针对复杂复合需求，研发先进的任务分解与多步推理算法，解决长链条执行中的错误积累与漂移问题。
    -Agentic-RL 策略： 构建基于 环境反馈的强化学习（RLHB/RLAIF） 体系，通过在模拟环境中的大规模探索，提升 Agent 在极端场景下的鲁棒性与决策上限。
    -领域知识注入： 针对高频场景（学习、办公、生活）进行长程预训练与持续学习，让 Agent 不仅拥有通用逻辑，更具备深度的行业专家意识。

3. 实际需求驱动迭代：
    - 建立科学、全面的Agent评测体系，通过线上数据分析、Bad Case挖掘，精准定位模型在幻觉、误拒答、组合泛化、执行失败等方面的瓶颈。
    - 领导数据驱动的迭代飞轮，不仅是利用线上反馈进行微调，更要探索世界模型模拟、合成数据生成、以及基于AI反馈的强化学习等手段，高效、规模化地提升统一智能体的能力上限。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

AI agent+

RAG+

还有更多 •••

登录查看完整学习资料

相关职位

千问C端事业群-大模型Agent算法专家（生态合作与智能协议）-杭州/北京

社招2年以上技术类-算法

我们正在重新定义“千问”：从一个博学的对话者进化为具备执行力的数字实体。我们的核心使命是构建一套统一的认知架构，打破模型与现实世界的壁垒。通过 Skill-based Agent 技术，实现从“语义理解”到“任务闭环”的跨越，让 AI 真正深入生产力场景，实现数字世界与物理世界的高效连接 1. 统一认知架构设计与能力演进： - 深度对接阿里集团内部及外部第三方服务，设计并实现高效、稳定的 Agent 框架。负责将复杂的业务逻辑抽象为可插拔的配置、标准化的工具，供大模型理解与调用。 - 设计 skill-based 【统一Agent】架构，实现长程规划与自我反思能力的统一认知架构，以协调内部的推理、记忆和执行模块，实现统一智能体在跨场景、长链条任务上的优异表现。 - 推动并构建一个动态的“千问能办” skill library，将海量、异构的原子能力抽象为该统一智能体可学习、可组合、可泛化的skill，探索自动化技能发现与组合优化的前沿方法。 2. 核心场景算法优化： ⁃长程规划与决策优化：针对复杂复合需求，研发先进的任务分解与多步推理算法，解决长链条执行中的错误积累与漂移问题。 -Agentic-RL 策略：构建基于环境反馈的强化学习（RLHB/RLAIF）体系，通过在模拟环境中的大规模探索，提升 Agent 在极端场景下的鲁棒性与决策上限。 -领域知识注入：针对高频场景（学习、办公、生活）进行长程预训练与持续学习，让 Agent 不仅拥有通用逻辑，更具备深度的行业专家意识。 3. 实际需求驱动迭代： - 建立科学、全面的Agent评测体系，通过线上数据分析、Bad Case挖掘，精准定位模型在幻觉、误拒答、组合泛化、执行失败等方面的瓶颈。 - 领导数据驱动的迭代飞轮，不仅是利用线上反馈进行微调，更要探索世界模型模拟、合成数据生成、以及基于AI反馈的强化学习等手段，高效、规模化地提升统一智能体的能力上限。

更新于 2026-03-31北京|杭州

大模型Agent算法专家

社招1-3年大模型

职位背景：小红书作为用户的“生活决策指南”，每天承载海量的搜索与浏览需求。我们正在从传统的“信息检索”向“意图满足与服务分发”进化。你将加入核心算法团队，负责建设小红书社区原生的 Agent 平台。利用 LLM、RAG、Multi-Agent 等前沿技术，深度理解用户复杂的非结构化 Query（如旅游攻略、装修避坑、穿搭建议），调度全站笔记、商品与工具资源，为用户提供能够直接解决问题的“智能方案”。岗位职责： Agent 核心架构建设：负责通用 Agent 框架的设计与研发，包括意图识别（Router）、任务编排（Planning）、工具调用（Function Calling）及多轮对话状态管理（Memory），构建支持高并发、低延迟的在线智能分发系统。大模型调优与对齐：基于开源或自研基座模型，利用 SFT、RL 等技术进行垂直领域微调。增强模型的小红书风格化表达（社区感）、复杂指令遵循能力及工具调用准确率等。垂类智能体落地：深入旅游、美妆、装修、法律等核心垂类，设计专有的 Workflow，打通笔记、商卡、POI 等结构化数据，提升用户从“搜索”到“决策”的转化效率。评测与迭代体系：建设 Agent 自动化评测平台（LLM-as-a-Judge），制定涵盖准确性、相关性、有用性及安全性的多维评估指标，通过离线评测与在线 A/B 实验持续驱动效果优化。

更新于 2026-07-07上海|北京

高德-大模型/Agent 算法专家-视觉技术中心

社招3年以上技术类-算法

团队介绍：作为中国领先的数字地图内容及导航服务提供商，高德地图日均服务数亿用户出行决策，每日处理超百亿级位置数据。视觉技术中心是驱动高德实现高精度地图、三维重建、LLM/VLM，AI Agent等核心技术，持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。团队不仅在计算机视觉领域持续深耕，更将计算机视觉及AI技术在自主导航、高德打车、生活服务等多元化应用场景。作为高德地图的核心技术驱动部门，我们以下一代三维地图引擎、多模态理解与生成、空间智能、世界模型等方向为核心，推动智能出行与真实世界连接的深度融合。团队gihub主页： https://github.com/amap-cvlab 为何加入我们？ 1. 挑战业界顶尖难题：处理百亿级位置数据，攻克动态世界中海量POI的实时、精准感知与理解，定义未来地图的“AI之眼”。 2. 驱动国民级应用创新：你的技术将直接应用于高德地图数亿用户依赖的扫街榜等核心功能，实现从技术突破到产品颠覆的全流程落地。 3. 置身前沿技术浪潮：在三维地图、世界模型、具身智能等前沿领域进行深度探索与研发。 4. 预研与业务深度结合：在这里，你将同时接触到面向未来的技术预研和支撑亿级用户的业务算法。我们提供从0到1的创新探索环境，也看重从1到N的规模化落地能力。职位描述： 1.主导基于大模型的AI Agent全生命周期研发，包括通用型及垂直领域AI Agent的应用架构设计、数据构建、模型训练与评测； 2. 运用SFT、RL等Post-training训练方法，探索多模态与RL的结合，提升大模型/多模态大模型在自主规划（Planning）、多步推理、多模态RAG、工具调用、复杂指令理解等方面的能力； 3.跟踪LLM、VLM与Agent领域的国际前沿技术动态，推动技术创新在业务场景中的落地应用。

更新于 2026-04-08北京

AI创新事业部-大模型Agent应用算法专家-未来生活实验室

社招3年以上技术类-算法

深入研究AI应用算法，探索LLM在深度推理、深度研究（Deep Research）、Code Agent、多模态Agent等领域的技术研究，包括 AI搜索，Plan、Tool Usage、Memory、Agent Reasoning、多模态理解等技术，推动AI技术在智能体产品应用中的突破。探索工业级的Agent算法架构方案，提升Agent系统的执行效率和结果对齐准确度。在创新应用场景中，优化长上下文场景的Agent推理算法架构，提升Agent解决任务复杂度，探索System2技术边界。针对重点方向如Agentic Search，Memory，进行端到端优化，包括系统算法框架设计、模型训练等，解决实际应用相关问题。跟进大模型智能体前沿技术趋势，结合实际业务需求，将技术应用到实际业务场景；

更新于 2026-03-31北京|杭州