通义研究型实习生-大模型智能体框架、算法和应用探索
任职要求
1. 具备扎实的计算机基础和工程实现能力。 2. 熟悉大语言模型原理,并具备相关实践经验。 3. 具备强化学习理论基础和/或智能体系统实践经验。 …
工作职责
本团队专注于大模型智能体领域的前沿探索,涵盖智能体框架、算法及实际应用等方面,诚邀具备扎实科研能力与工程素养的候选人加入,针对智能体展开系统性的深入研究,积极探索新一代智能体的开发范式与创新应用形态。 1. 开展大模型智能体的算法研究,重点方向包括但不限于数据合成方法、奖励建模机制、强化微调流程,智能体环境构建,智能体评测等。 2. 研发高可用的智能体框架,探索新一代智能体应用开发范式。 3. 参与真实应用场景中智能体的研发与探索。 4. 参与开源项目的技术开发与社区共建,推动研究成果在开源社区的应用。
研究领域: 人工智能 项目简介: 【攻击】蚁鉴作为蚁天鉴大模型安全一体化解决方案的重要组成部份之一,聚焦于大语言模型潜在输出内容安全的主动挖掘和模型安全能力的量化评测。随着大模型的应用场景不断扩增,使用场景不断多样化,模态增加,agent组件增加,其暴露出来的潜在风险问题也随之扩大。我们希望通过建立一套自动化选件红队体系,挖掘更多的风险,研发更高攻击成功率的方法。从而更快,更全面地发现风险,评估风险,解决风险。当前评测遇到挑战: 1、如何批量的自动发现扫描未知的安全风险; 2、多模态agent 大模型安全评测方案设计; 3、如何对非API的复杂智能体(例如支小宝)进行评测; 4、大模型其他安全问题的研究,例如:能耗攻击,后门,可解释性等; 【防御】大模型对齐作为蚁天鉴安全护栏核心能力之一,对于不安全或者有攻击性的query,在response的价值观等安全性方面往往能表现出更加优秀的性能,在安全链路中发挥着及其重要的作用。 然而,内容安全大模型依然存在大模型的不足: 1. 与语言模型相比,多模内容安全大模型在内容的理解和生成存在许多跨域风险的理解与对齐问题。 2. 幻觉问题,对于一些低频知识依然存在幻觉,特别是在涉政场景,幻觉问题的影响会被放大。 3. 模型难以可控生成,对于一些紧急badcase修复和业务调整依然需要大量数据重新训练成本较高,无法进行及时高效地局部模型知识更新。 4. 推理模型安全性研究与防控。
专注于多模态智能体(Agent)及强化学习(RL)的研究与开发,如 browser use 等,推动下一代智能决策系统的创新。主要职责包括: 1. 设计和构建基于 Qwen 系列模型的多模态 Agent,使其能够高效处理文本、图像、视频等多种信息,执行复杂任务; 2. 实现和训练强化学习算法,探索如何在多模态环境下优化智能体的决策策略; 3. 开发数据采集和环境建模工具,构建逼真的多模态交互环境; 4. 参与系统评估与优化,设计高效的验证机制,确保智能体的稳定性与泛化能力; 5. 撰写研究论文、技术文档,与团队共同推动技术突破,并提升行业影响力。
随着大模型与智能体系统的发展,数据正从“静态燃料”演变为“动态认知基础设施”。传统数据处理范式难以满足Agent工作流、强化学习、RAG等新场景对语义理解、任务适配与反馈闭环的需求。一系列重要问题亟需重新思考:什么是面向未来 AI 系统的“高质量数据”?如何构建可解释、可组合、可迭代的数据智能框架? 我们隶属于通义实验室,长期聚焦 AI 基础设施与数据智能方向。团队已在ICML、NeurIPS、ICLR、SIGMOD、KDD、WWW等国际顶会发表论文数十篇,多次获 Spotlight 与 Best Paper,主导开源 DataJuicer、AgentScope、Trinity-RFT 等框架。相关成果广泛应用于学术界与工业界,支撑阿里云、通义大模型、百炼平台等内外部业务。 现诚邀具备扎实科研能力与工程素养的候选人加入,你将参与: 1. 探索如何让数据处理系统“听懂”任务语义,自动生成可验证、可复用、可优化的数据流水线; 2. 研究高性能方法,量化建模文本、图像、轨迹等数据对下游任务的实际价值,构建数据健康评估体系; 3. 面向智能体经验管理、RAG 上下文筛选、多模态日志分析等真实场景,设计新型数据原语与评估基准; 4. 建设开源框架(DataJuicer、AgentScope、Trinity-RFT),发表高水平论文或技术成果,推动社区对“数据智能”的前沿探索。
专注于文档理解、推理、生成大模型的研究、探索和开发,具体职责包括: 1、通过研究长文本压缩算法、multi-agent协同、long cot、数据自动合成技术等提升超长文本、多文档能力; 2、通过研究PPO、DPO、RFT、GRPO等强化学习技术,提升文档大模型的推理能力、复杂指令遵循和泛化性; 3、研究文档创作技术,提升大模型的写作、纠错、改写、仿写、风格化、长文本输出、字数遵循等创作能力; 4、研究多模态文档解析和理解技术,提升多模态文档细粒度理解、多模态多页长文档、多模态复杂推理等技术; 5、研究面向法律行业文档理解和推理关键技术。