logo of tongyi

通义大语言基础模型Agent System算法工程师

校招全职通义2026届秋季校园招聘地点:北京 | 杭州 | 上海状态:招聘

任职要求


1. 来自全球Top高校计算机科学、人工智能、机器学习深度学习、软件工程,或相关领域应届毕业生,博士/硕士毕业生优先。
2. 有良好的学术调研能力,工程能力,逻辑和数据分析能力,热衷于Agentic AI,有 agent system 相关研发经验;具备扎实的代码功底,精通PythonC/C++等至少一门编程语言;熟悉强化学习算法和智能agent框架,具备跨领域应用的经验。
3. 对基础模型的前沿问题有持续热情,具备独立思考能力和系统性研究思维,敢于挑战现有范式。能够独立应用技术解决复杂问题,主导或深度参与过有影响力项目的人选优先。
4. 在国际顶级计算机会议/期刊(如NeurIPSICMLICLRACLTPAMI等)以一作身份发表论文,或在开源社区、计算机领域竞赛中有突出研究成果和项目经历的人选优先。
5. 具备跨学科视野与协作意识,能够与工程、产品等多学科团队紧密合作,推动研究成果快速落地并产生实际影响力。

工作职责


通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。

团队致力于优化Qwen基础大模型的Agent能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent的工作包括从模型侧通过 SFT、RL等提升模型的基础agent能力,让模型和 agent框架有效结合;同时也包括agent system的设计与实现,致力于agentic AI真实落地。

1. 从事Qwen基础大模型的通用agent能力优化,包括但不限于tool use、RAG、planning、memory等能力的算法研发和优化;跟进业界agent benchmark,保持Qwen的agent行业领先水平。
2. 推进agentic AI的发展,包括但不限于多模态 agent、code agent、MCP、deep research 等场景的模型优化与产品落地。
3. 研发agent system,推动AI Agent在架构和性能上的持续优化。
4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。
5. 主导数据收集、环境建模及 agent 的评估与测试工作,确保模型的稳定性和有效性。
包括英文材料
机器学习+
深度学习+
数据分析+
AI agent+
Python+
C+
C+++
强化学习+
算法+
NeurIPS+
ICML+
ACL+
TPAMI+
相关职位

logo of tongyi
社招1年以上技术类-算法

我们致力于优化 Qwen 基础大模型的 Agent 能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent 的工作一方面包括从模型侧通过SFT、RL等提升模型的基础Agent能力,让我们的模型能和Agent框架有效结合;另一方面包括Agent System的设计与实现,致力于Agentic AI真实落地。 职位描述: 1. 从事Qwen基础大模型的通用 Agent 能力优化,包括但不限于Tool use、RAG、Planning、Memory等能力的算法研发和优化;跟进业界Agent Benchmark,保持Qwen的Agent行业领先水平。 2. 推进Agentic AI的发展,包括但不限于多模态 Agent、Code Agent、MCP、Deep Research等场景的模型优化与产品落地。 3. 研发Agent System,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 Agent 的评估与测试工作,确保模型的稳定性和有效性。

更新于 2025-07-04
logo of dingtalk
社招5年以上技术类-算法

1.负责构建具备自主决策、协作与工具调用能力的多智能体系统(Multi-Agent System),推动大模型从“对话式AI”向“任务执行体”演进,解决复杂场景下的自动化问题。 2.深入研究并应用LLM的复杂推理技术(如思维链CoT、思维树ToT),攻克开放式、复杂问题的深度研究模式,赋予Agent独立探索与解决问题的能力。 3. 运用指令微调、强化学习等方法,提升大模型规划、推理与遵循指令的能力,从而提升模型知识边界探索和抗干扰的能力。

更新于 2025-09-03
logo of amap
实习高德地图2026

团队介绍: 高德地图为您导航,前方路口请“左转”,我们是高德地图交通&行中智能团队。 我们的使命是基于高德海量高质的数据,最前沿的AI算法,最可靠的工程架构,打造有温度、有惊喜、科技感十足的智能出行体验; 在这里,我们一起建设应对超大业务规模,超高业务复杂度的高效、可靠、鲁棒的技术架构;一起用最前沿的机器学习、深度学习、AI算法探索导航领域最具挑战性的行业难题;一起用最尖端的AIGC、LLM/LVM、多模态理解与生成、Agent等技术,打造全新的出行交互体验; 团队简单直接、有情有义、温暖有爱,欢迎加入,一起用技术驱动创新,为海量用户护航! 职位职责包括但不限于: 基于前沿的AIGC、LLM/LVM、MLLM多模态理解与生成、AI Agent等技术,实现高德地图导航过程全场景、全时空、多模态的内容理解/生成以及智能交互,不断提升用户的出行质量和体验。

更新于 2025-03-06
logo of bytedance
社招A128692

团队介绍:BandAI 团队致力于探索智能的极限在交易场景的可能性。团队研究方向涵盖LLM、Multimodal、Agent,在北京、上海设有实验室和岗位。加入我们,你可以享受与正式员工同等的资源,参与到前沿的大语言模型的研究课题,和优秀的研究员一起探索智能极限。探索抖音电商、生活服务的下一代产品和技术,通过技术变革为用户带来前所未有的体验。 课题介绍:探索抖音电商、生活服务、广告的下一代产品和技术,通过技术变革为用户带来前所未有的体验。在你热爱的课题方向上,探索大语言模型领域最具挑战的长期关键问题;探索 Agent 评估的新范式;探索 RL,更多的计算能力=更好的性能表现;探索如何拓展 Reward System 判断边界;研究&复现 Deep Research,Computer Using Agent,Useful Image Generation,Native Multimodality。

更新于 2025-05-27