通义大语言基础模型Agent System算法工程师
任职要求
1. 来自全球Top高校计算机科学、人工智能、机器学习、深度学习、软件工程,或相关领域应届毕业生,博士/硕士毕业生优先。 2. 有良好的学术调研能力,工程能力,逻辑和数据分析能力,热衷于Agentic AI,有 agent system 相关研发经验;具备扎实的代码功底,精通Python、C/C++等至少一门编程语言;熟悉强化学习算法和智能agent框架,具备跨领域应用的经验。 3. 对基础模型的前沿问题有持续热…
工作职责
通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 团队致力于优化Qwen基础大模型的Agent能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent的工作包括从模型侧通过 SFT、RL等提升模型的基础agent能力,让模型和 agent框架有效结合;同时也包括agent system的设计与实现,致力于agentic AI真实落地。 1. 从事Qwen基础大模型的通用agent能力优化,包括但不限于tool use、RAG、planning、memory等能力的算法研发和优化;跟进业界agent benchmark,保持Qwen的agent行业领先水平。 2. 推进agentic AI的发展,包括但不限于多模态 agent、code agent、MCP、deep research 等场景的模型优化与产品落地。 3. 研发agent system,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 agent 的评估与测试工作,确保模型的稳定性和有效性。
我们致力于优化 Qwen 基础大模型的 Agent 能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent 的工作一方面包括从模型侧通过SFT、RL等提升模型的基础Agent能力,让我们的模型能和Agent框架有效结合;另一方面包括Agent System的设计与实现,致力于Agentic AI真实落地。 职位描述: 1. 从事Qwen基础大模型的通用 Agent 能力优化,包括但不限于Tool use、RAG、Planning、Memory等能力的算法研发和优化;跟进业界Agent Benchmark,保持Qwen的Agent行业领先水平。 2. 推进Agentic AI的发展,包括但不限于多模态 Agent、Code Agent、MCP、Deep Research等场景的模型优化与产品落地。 3. 研发Agent System,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 Agent 的评估与测试工作,确保模型的稳定性和有效性。
我们致力于优化 Qwen 基础大模型的 Agent 能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent 的工作一方面包括从模型侧通过SFT、RL等提升模型的基础Agent能力,让我们的模型能和Agent框架有效结合;另一方面包括Agent System的设计与实现,致力于Agentic AI真实落地。 职位描述: 1. 从事Qwen基础大模型的通用 Agent 能力优化,包括但不限于Tool use、RAG、Planning、Memory等能力的算法研发和优化;跟进业界Agent Benchmark,保持Qwen的Agent行业领先水平。 2. 推进Agentic AI的发展,包括但不限于多模态 Agent、Code Agent、MCP、Deep Research等场景的模型优化与产品落地。 3. 研发Agent System,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 Agent 的评估与测试工作,确保模型的稳定性和有效性。
1、负责智能体(AI Agent)相关核心算法的研究与实现,构建具备多模态理解、规划、记忆、工具调用和任务执行能力的自主智能体体系; 2、参与大语言模型(LLM)在多轮对话、任务分解、知识检索、动作执行等环节的能力增强与优化; 3、设计并实现智能体的推理框架(Reasoning Framework),包括上下文记忆、长短期记忆融合(STM/LTM)、反思机制(Reflection Loop)、以及基于反馈的自我迭代策略; 4、负责Agent系统的工具生态构建,包括函数调用(Function Calling)、插件集成(Plugin Integration)、知识库检索(RAG)等,提升模型的可操作性与可解释性; 5、跟进业界前沿的大模型与Agent技术(如OpenAI o1、Anthropic Claude、MCP、LangChain、AutoGPT、OpenDevin等),并探索其在社交、内容、推荐、AIGC、商业化等场景的落地路径; 6、分析与解决模型在多轮推理、长上下文记忆、工具调用策略优化等过程中的技术瓶颈; 7、与产品、平台及算法团队紧密协作,将Agent能力嵌入真实业务流程中,并通过数据反馈实现持续演化。