logo of tongyi

通义通义实验室-大模型Agent System算法工程师-通义千问

社招全职1年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1. 精通PythonC/C++等至少一门编程语言。
2. 良好的学术调研能力,工程能力,良好的逻辑和数据分析能力,有高质量论文、开源项目、ACM竞赛经历、相关学术会议组织的权威比赛获奖经历或落地项目产出者优先。
3. 热衷于Agentic AI,有相关Agent System研发经验、有深度参与开源项目经验者优先。
4. 有良好的自我学习能力及自驱力,对前沿领域有强探索欲,富有想象力和创造力。

加分项
1. 熟悉强化学习算法和智能Agent框架,具备跨领域应用的经验。
2. 曾在计算机领域的顶级会议上发表过学术论文,具备扎实的科研能力。

工作职责


我们致力于优化 Qwen 基础大模型的 Agent 能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent 的工作一方面包括从模型侧通过SFT、RL等提升模型的基础Agent能力,让我们的模型能和Agent框架有效结合;另一方面包括Agent System的设计与实现,致力于Agentic AI真实落地。

职位描述:
1. 从事Qwen基础大模型的通用 Agent 能力优化,包括但不限于Tool use、RAG、Planning、Memory等能力的算法研发和优化;跟进业界Agent Benchmark,保持Qwen的Agent行业领先水平。
2. 推进Agentic AI的发展,包括但不限于多模态 Agent、Code Agent、MCP、Deep Research等场景的模型优化与产品落地。
3. 研发Agent System,推动AI Agent在架构和性能上的持续优化。
4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。
5. 主导数据收集、环境建模及 Agent 的评估与测试工作,确保模型的稳定性和有效性。
包括英文材料
Python+
C+
C+++
数据分析+
AI agent+
强化学习+
算法+
相关职位

logo of tongyi
校招通义2026届秋

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 团队致力于优化Qwen基础大模型的Agent能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent的工作包括从模型侧通过 SFT、RL等提升模型的基础agent能力,让模型和 agent框架有效结合;同时也包括agent system的设计与实现,致力于agentic AI真实落地。 1. 从事Qwen基础大模型的通用agent能力优化,包括但不限于tool use、RAG、planning、memory等能力的算法研发和优化;跟进业界agent benchmark,保持Qwen的agent行业领先水平。 2. 推进agentic AI的发展,包括但不限于多模态 agent、code agent、MCP、deep research 等场景的模型优化与产品落地。 3. 研发agent system,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 agent 的评估与测试工作,确保模型的稳定性和有效性。

更新于 2025-08-18
logo of tongyi
校招通义2026届秋

团队介绍: 团队聚焦大模型数据优化、模型调优、多智能体协同、LLM跨领域交叉等关键技术方向,诚邀具备扎实科研能力与工程素养的候选人加入,共同推进人工智能前沿技术的突破与应用。 岗位职责: 1. Agentic前沿研究探索和企业级系统架构: (1) 探索agent自我迭代学习范式,如数据合成、奖励建模、强化微调等,持续改善agent训练效率与效果。 (2) 构建高可用多智能体开发框架,探索多智能体交互新范式。 (3) 探索Human-in-the-loop的交互范式和反馈机制,实现Human和Agent之间的有效任务协作。 (4) Agent Runtime系统建设,助力Agent应用从POC阶段走向生产阶段。 (5) 参与垂直领域Agent应用研发和探索,打造行业垂类应用标杆。 2. 数据与模型协同优化: (1) 探索训练数据处理和优化方法,优化数据菜谱,进而提升模型效果。 (2) 探索结构化数据(SQL)与非结构化数据(如文本、图像、音频等)在应用场景下的有效处理、融合和使用。 3. 开源项目的技术研发与社区共建,推动研究成果开源社区的推广。

更新于 2025-08-13
logo of amap
实习高德地图2026

团队介绍: 高德地图为您导航,前方路口请“左转”,我们是高德地图交通&行中智能团队。 我们的使命是基于高德海量高质的数据,最前沿的AI算法,最可靠的工程架构,打造有温度、有惊喜、科技感十足的智能出行体验; 在这里,我们一起建设应对超大业务规模,超高业务复杂度的高效、可靠、鲁棒的技术架构;一起用最前沿的机器学习、深度学习、AI算法探索导航领域最具挑战性的行业难题;一起用最尖端的AIGC、LLM/LVM、多模态理解与生成、Agent等技术,打造全新的出行交互体验; 团队简单直接、有情有义、温暖有爱,欢迎加入,一起用技术驱动创新,为海量用户护航! 职位职责包括但不限于: 基于前沿的AIGC、LLM/LVM、MLLM多模态理解与生成、AI Agent等技术,实现高德地图导航过程全场景、全时空、多模态的内容理解/生成以及智能交互,不断提升用户的出行质量和体验。

更新于 2025-03-06
logo of dingtalk
社招5年以上技术类-算法

1.负责构建具备自主决策、协作与工具调用能力的多智能体系统(Multi-Agent System),推动大模型从“对话式AI”向“任务执行体”演进,解决复杂场景下的自动化问题。 2.深入研究并应用LLM的复杂推理技术(如思维链CoT、思维树ToT),攻克开放式、复杂问题的深度研究模式,赋予Agent独立探索与解决问题的能力。 3. 运用指令微调、强化学习等方法,提升大模型规划、推理与遵循指令的能力,从而提升模型知识边界探索和抗干扰的能力。

更新于 2025-09-03