通义大语言基础模型Agent System算法工程师
任职要求
1. 来自全球Top高校计算机科学、人工智能、机器学习、深度学习、软件工程,或相关领域应届毕业生,博士/硕士毕业生优先。 2. 有良好的学术调研能力,工程能力,逻辑和数据分析能力,热衷于Agentic AI,有 agent system 相关研发经验;具备扎实的代码功底,精通Python、C/C++等至少一门编程语言;熟悉强化学习算法和智能agent框架,具备跨领域应用的经验。 3. 对基础模型的前沿问题有持续热…
工作职责
通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 团队致力于优化Qwen基础大模型的Agent能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent的工作包括从模型侧通过 SFT、RL等提升模型的基础agent能力,让模型和 agent框架有效结合;同时也包括agent system的设计与实现,致力于agentic AI真实落地。 1. 从事Qwen基础大模型的通用agent能力优化,包括但不限于tool use、RAG、planning、memory等能力的算法研发和优化;跟进业界agent benchmark,保持Qwen的agent行业领先水平。 2. 推进agentic AI的发展,包括但不限于多模态 agent、code agent、MCP、deep research 等场景的模型优化与产品落地。 3. 研发agent system,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 agent 的评估与测试工作,确保模型的稳定性和有效性。
通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备跨语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从几百 M 到 T 级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 我们致力于优化 Qwen 基础大模型的 Agent 能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent 的工作一方面包括从模型侧通过SFT、RL等提升模型的基础Agent能力,让我们的模型能和Agent框架有效结合;另一方面包括Agent System的设计与实现,致力于Agentic AI真实落地。 职位描述: 1. 从事Qwen基础大模型的通用 Agent 能力优化,包括但不限于Tool use、RAG、Planning、Memory等能力的算法研发和优化;跟进业界Agent Benchmark,保持Qwen的Agent行业领先水平。 2. 推进Agentic AI的发展,包括但不限于多模态 Agent、Code Agent、MCP、Deep Research等场景的模型优化与产品落地。 3. 研发Agent System,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 Agent 的评估与测试工作,确保模型的稳定性和有效性。

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备跨语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从几百 M 到 T 级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 我们致力于优化 Qwen 基础大模型的 Agent 能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent 的工作一方面包括从模型侧通过SFT、RL等提升模型的基础Agent能力,让我们的模型能和Agent框架有效结合;另一方面包括Agent System的设计与实现,致力于Agentic AI真实落地。 职位描述: 1. 从事Qwen基础大模型的通用 Agent 能力优化,包括但不限于Tool use、RAG、Planning、Memory等能力的算法研发和优化;跟进业界Agent Benchmark,保持Qwen的Agent行业领先水平。 2. 推进Agentic AI的发展,包括但不限于多模态 Agent、Code Agent、MCP、Deep Research等场景的模型优化与产品落地。 3. 研发Agent System,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 Agent 的评估与测试工作,确保模型的稳定性和有效性。
我们致力于优化 Qwen 基础大模型的 Agent 能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent 的工作一方面包括从模型侧通过SFT、RL等提升模型的基础Agent能力,让我们的模型能和Agent框架有效结合;另一方面包括Agent System的设计与实现,致力于Agentic AI真实落地。 职位描述: 1. 从事Qwen基础大模型的通用 Agent 能力优化,包括但不限于Tool use、RAG、Planning、Memory等能力的算法研发和优化;跟进业界Agent Benchmark,保持Qwen的Agent行业领先水平。 2. 推进Agentic AI的发展,包括但不限于多模态 Agent、Code Agent、MCP、Deep Research等场景的模型优化与产品落地。 3. 研发Agent System,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 Agent 的评估与测试工作,确保模型的稳定性和有效性。
Accio是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品,也是全球首个B2B AI Search Agent,通过持续探索Agent、LLM、VLM、RL、Memory、Reasoning、AI Search等前沿技术,自研基座、Agent系统以及AI Search系统,实现全球B2B跨境贸易跨越式发展。 1、参与跨境电商多语言多模态大模型研发,包括而不限于Post-Training、SFT、RLHF、RL、Memory等全链路建设; 2、负责AI Native专项能力建设,包括而不限于RAG System、Agent System、Function Call、Reasoning、Agentic RL、Proactive Agent、LangChain; 3、探索LLM前沿技术,持续迭代自研模型能力,推动Native AI Agent落地,重构B2B跨境贸易交互体验。