logo of quark

夸克千问C端事业群-大模型记忆算法专家-杭州/上海

社招全职3年以上技术类-算法地点:杭州状态:招聘

任职要求


1. 计算机、数学、统计学相关专业,硕士及以上学历;3年及以上NLP算法经验;
2. 熟悉NLP领域前沿技术,有LLM对话系统建设相关经验,对qwen、gemini等文本、视觉、全模态模型较为熟悉,需有可验证的大模型项…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责语音助手场景的记忆相关能力建设,包括对话数据、行为数据、应用数据的记忆生成和召回链路;
2. 负责大模型在记忆机制(如外部记忆库、长期上下文管理)和数据处理(如机器数据预标注、质检)方面的算法研究与开发;
3. 记忆相关agent算法研发,保证记忆能力在对话中控、领域agent、个性化交互等场景的高质量交付。
包括英文材料
学历+
NLP+
算法+
大模型+
还有更多 •••
相关职位

logo of quark
社招2年以上技术类-算法

我们正在重新定义“千问”:从一个博学的对话者进化为具备执行力的数字实体。我们的核心使命是构建一套统一的认知架构,打破模型与现实世界的壁垒。通过 Skill-based Agent 技术,实现从“语义理解”到“任务闭环”的跨越,让 AI 真正深入生产力场景,实现数字世界与物理世界的高效连接 1. 统一认知架构设计与能力演进: - 深度对接阿里集团内部及外部第三方服务,设计并实现高效、稳定的 Agent 框架。负责将复杂的业务逻辑抽象为可插拔的配置、标准化的工具,供大模型理解与调用。 - 设计 skill-based 【统一Agent】架构,实现长程规划与自我反思能力的统一认知架构,以协调内部的推理、记忆和执行模块,实现统一智能体在跨场景、长链条任务上的优异表现。 - 推动并构建一个动态的“千问能办” skill library,将海量、异构的原子能力抽象为该统一智能体可学习、可组合、可泛化的skill,探索自动化技能发现与组合优化的前沿方法。 2. 核心场景算法优化: ⁃长程规划与决策优化: 针对复杂复合需求,研发先进的任务分解与多步推理算法,解决长链条执行中的错误积累与漂移问题。 -Agentic-RL 策略: 构建基于 环境反馈的强化学习(RLHB/RLAIF) 体系,通过在模拟环境中的大规模探索,提升 Agent 在极端场景下的鲁棒性与决策上限。 -领域知识注入: 针对高频场景(学习、办公、生活)进行长程预训练与持续学习,让 Agent 不仅拥有通用逻辑,更具备深度的行业专家意识。 3. 实际需求驱动迭代: - 建立科学、全面的Agent评测体系,通过线上数据分析、Bad Case挖掘,精准定位模型在幻觉、误拒答、组合泛化、执行失败等方面的瓶颈。 - 领导数据驱动的迭代飞轮,不仅是利用线上反馈进行微调,更要探索世界模型模拟、合成数据生成、以及基于AI反馈的强化学习等手段,高效、规模化地提升统一智能体的能力上限。

更新于 2026-03-31北京|杭州
logo of aligenie
社招2年以上技术类-算法

我们正在重新定义“千问”:从一个博学的对话者进化为具备执行力的数字实体。我们的核心使命是构建一套统一的认知架构,打破模型与现实世界的壁垒。通过 Skill-based Agent 技术,实现从“语义理解”到“任务闭环”的跨越,让 AI 真正深入生产力场景,实现数字世界与物理世界的高效连接 1. 统一认知架构设计与能力演进: - 深度对接阿里集团内部及外部第三方服务,设计并实现高效、稳定的 Agent 框架。负责将复杂的业务逻辑抽象为可插拔的配置、标准化的工具,供大模型理解与调用。 - 设计 skill-based 【统一Agent】架构,实现长程规划与自我反思能力的统一认知架构,以协调内部的推理、记忆和执行模块,实现统一智能体在跨场景、长链条任务上的优异表现。 - 推动并构建一个动态的“千问能办” skill library,将海量、异构的原子能力抽象为该统一智能体可学习、可组合、可泛化的skill,探索自动化技能发现与组合优化的前沿方法。 2. 核心场景算法优化: ⁃长程规划与决策优化: 针对复杂复合需求,研发先进的任务分解与多步推理算法,解决长链条执行中的错误积累与漂移问题。 -Agentic-RL 策略: 构建基于 环境反馈的强化学习(RLHB/RLAIF) 体系,通过在模拟环境中的大规模探索,提升 Agent 在极端场景下的鲁棒性与决策上限。 -领域知识注入: 针对高频场景(学习、办公、生活)进行长程预训练与持续学习,让 Agent 不仅拥有通用逻辑,更具备深度的行业专家意识。 3. 实际需求驱动迭代: - 建立科学、全面的Agent评测体系,通过线上数据分析、Bad Case挖掘,精准定位模型在幻觉、误拒答、组合泛化、执行失败等方面的瓶颈。 - 领导数据驱动的迭代飞轮,不仅是利用线上反馈进行微调,更要探索世界模型模拟、合成数据生成、以及基于AI反馈的强化学习等手段,高效、规模化地提升统一智能体的能力上限。

更新于 2026-03-31北京|杭州
logo of quark
社招3年以上技术类-算法

1. 文本理解与生成能力建设:基于大语言模型,负责「小说理解、剧情/文案生成、内容质量评估」等模块的方案设计、效果评估与模型微调工作,持续提升创作流程的稳定性、可控性与风格一致性。 2. 内容创作 Agent 架构:参与内容创作 Agent 架构设计,独立负责任务规划、工具调用、记忆与检索等其中若干核心模块的实现与优化,提升从需求到成稿的自动化程度。 3. 新技术探索与小规模落地:跟进大模型与 Agent 相关的新技术,主动发起小型实验与 Demo,从想法验证到功能落地,推动在公司内容产品中的实际应用。 4. 跨团队协作与效果迭代:与产品、内容创作团队紧密合作,理解创作流程和业务目标,通过数据分析、实验(如 A/B 测试)等方式,持续优化用户体验与核心指标。

更新于 2026-04-02北京
logo of aligenie
社招3年以上技术类-算法

1. 文本理解与生成能力建设:基于大语言模型,负责「小说理解、剧情/文案生成、内容质量评估」等模块的方案设计、效果评估与模型微调工作,持续提升创作流程的稳定性、可控性与风格一致性。 2. 内容创作 Agent 架构:参与内容创作 Agent 架构设计,独立负责任务规划、工具调用、记忆与检索等其中若干核心模块的实现与优化,提升从需求到成稿的自动化程度。 3. 新技术探索与小规模落地:跟进大模型与 Agent 相关的新技术,主动发起小型实验与 Demo,从想法验证到功能落地,推动在公司内容产品中的实际应用。 4. 跨团队协作与效果迭代:与产品、内容创作团队紧密合作,理解创作流程和业务目标,通过数据分析、实验(如 A/B 测试)等方式,持续优化用户体验与核心指标。

更新于 2026-04-02北京