logo of tongyi

通义大模型智能体研究-算法工程师

校招全职通义2026届秋季校园招聘地点:北京 | 杭州状态:招聘

任职要求


1. 来自全球Top高校计算机科学、人工智能、机器学习深度学习、数据库相关领域应届毕业生,博士/硕士毕业生优先。
2. 具备强化学习、多智能体系统(Multi-Agent Systems)的理论基础和实践经验。
3. 具备扎实的计算机基础与工程实现能力,对数据库和结构化数据处理有较好的理论和实践经验。
4. 熟悉主流深度学习框架 & 大模型微调框架,如:PyTorch / HuggingFace / Swift / OpenRLHF等。
5. 在国际顶级计算机会议/期刊(如NeurIPSICMLICLR、ACL、SIGMOD、VLDB、ICDE、KDD等)以一作身份发表论文者优先。
6. 在开源社区有突出开源项目经历,开源项目核心贡献者优先。
7. 熟悉大语言模型(LLM)原理,并具备相关实践经验者优先。
8. 获得 ACM 或 ML/NLP/CV 相关竞赛奖项者优先。
9. 有良好的自我学习能力及自驱力,对前沿领域有强探索欲和好奇心、善于独立思考并反思总结;具备良好的沟通能力和团队协作能力。

工作职责


团队介绍:
团队聚焦大模型数据优化、模型调优、多智能体协同、LLM跨领域交叉等关键技术方向,诚邀具备扎实科研能力与工程素养的候选人加入,共同推进人工智能前沿技术的突破与应用。

岗位职责:
1. Agentic前沿研究探索和企业级系统架构:
   (1) 探索agent自我迭代学习范式,如数据合成、奖励建模、强化微调等,持续改善agent训练效率与效果。
   (2) 构建高可用多智能体开发框架,探索多智能体交互新范式。
   (3) 探索Human-in-the-loop的交互范式和反馈机制,实现Human和Agent之间的有效任务协作。
   (4) Agent Runtime系统建设,助力Agent应用从POC阶段走向生产阶段。
   (5) 参与垂直领域Agent应用研发和探索,打造行业垂类应用标杆。
2. 数据与模型协同优化:
   (1) 探索训练数据处理和优化方法,优化数据菜谱,进而提升模型效果。
   (2) 探索结构化数据(SQL)与非结构化数据(如文本、图像、音频等)在应用场景下的有效处理、融合和使用。
3. 开源项目的技术研发与社区共建,推动研究成果开源社区的推广。
包括英文材料
机器学习+
深度学习+
强化学习+
智能体+
AI agent+
大模型+
PyTorch+
Swift+
NeurIPS+
ICML+
NLP+
相关职位

logo of meituan
校招金融服务平台

负责金融场景的大模型的研发和应用,研究相关技术在AI营销、AI风控、AI客服、AI催收领域的落地价值和解决方案,通过AI赋能业务,满足业务迅速增长的智能交互、智能决策需求。 研究方向一:基于大模型的多轮对话理解与生成 1.深入参与对话机器人在数据建设、指令微调、偏好对齐、强化学习、推理优化等环节的建设; 2.研究和解决大模型落地的关键问题,如检索增强、长文本理解、模型小型化技术等,并提升训练-评测的迭代效率。 研究方向二:大模型智能体算法研究 1.负责基于大模型的智能体架构构建,实现复杂问题的理解规划、工具执行以及感知反思能力; 2.探索最前沿技术,设计算法迭代飞轮,优化大模型基础模型,高效提升模型效果; 3.负责多智能体架构设计与落地,在多个金融业务场景中应用。

更新于 2025-05-23
logo of mi
校招

1. 构建行业有影响力的各类智能体和研究对应学术前沿问题,训练业界效果领先的大模型智能体模型,并通过发表论文、开源、竞赛等,打造学术影响力; 2. 打造业界一流的通用大模型智能体解决方案,并落地小米核心业务。 【课题名称】 大模型智能体研究与应用 【课题内容】 构建行业有影响力的各类智能体和研究对应学术前沿问题,包括但不限于: 1. 研究通用任务AI Agent核心技术,包括但不限于规划、工具调用、多智能体等,并构建和开源业界有影响力的AI Agent模型和解决方案; 2. 研究GUI Agent相关核心技术,包括但不限于SFT、离线强化学习、在线强化学习等,并训练和开源业界有影响力的GUI Agent模型; 3. 研究强化学习算法全流程核心技术,包括但不限于算法优化,奖励函数设计、环境构建等,并基于强化学习构建和开源业界有影响力的推理大语言模型、GUI Agent模型、deep search模型等; 4. 研究RAGRAG全流程核心技术,包括但不限于音-视-文全模态理解与生成、端侧RAG等,并推动相关领域技术突破和业务落地。

更新于 2025-06-25
logo of meituan
校招核心本地商业-基

基础算法研究 一、推理思考 1.开发链式思考、思维树等推理增强技术,优化模型对复杂业务逻辑推理、策略规划等任务的深度理解。 2.探索通过大规模强化学习持续提升模型推理能力。 3. 构建业务逻辑推理评测基准,推动模型思维链的可解释性研究。 二、多模态端到端 1.研发语音-文本跨模态对齐与联合表示学习算法,解决语义鸿沟问题,提升模型对语音指令理解、语音到文本生成的鲁棒性。 2.探索语音交互场景下的多模态增强技术(如语音情感分析、端到端语音对话生成),推动模型在智能客服、语音助手的应用落地。 三、生活服务领域增强 1.大模型基座知识能力增强,打造生活服务领域基座,赋能美团各类大模型应用场景; 2.探索预训练增强阶段的大规模高质量数据自动合成、Scaling Law、长链条复杂推理反思能力增强; 3.建设生活服务chat模型与智能体,通过强化学习等方式增强模型推理反思、复杂指令遵循、高情商交互等能力。 应用算法研究 一、深度推理、规划与决策能力强化 1.优化大模型在逻辑推理、多步规划、复杂决策、多轮多步工具调用等任务上的表现,探索如RL scaling、Test-time scaling等前沿技术。 2.构建能够处理模糊与不完全信息、进行自主假设与验证的推理框架。赋能大模型实现精准的工具调用与智能体协同。 二、高度拟人化交互与专业沟通能力构建 1.赋予模型深度理解与分析专业领域问题的能力,包括隐性需求挖掘和复杂语境下的语义理解。 2.探索多轮对话中的上下文记忆、情绪感知、共情表达与高情商交互技巧,实现稳定人设、知识遵循与高度自然的对话风格。 3.研究模型主动感知用户全面信息、进行预判性服务与信息推送的策略,而非被动响应,打造能真正吸引用户持续对话的自主交互。 三、多智能体协作研发范式与前沿技术应用 1.设计和研究多智能体间的动态协调、知识/记忆共享与冲突解决机制,实现“1+1>>2”的协同效应。 2.推动面向智能体的大模型研发新范式,探索大模型智能体在环境感知、记忆与知识库管理、复杂指令遵循等基础能力的统一建模与提升路径。 四、基于强化学习的智能体优化方法研究 1.研究和改进现有的强化学习算法,实现端到端Agent性能优化,提升Agent鲁棒性与泛化能力。 2.构建面向领域任务的DeepResearch能力,提升Agent在多步骤信息检索、工具调用、推理规划等任务中的表现。

更新于 2025-05-23
logo of meituan
社招2年以上核心本地商业-基

美团基础研发平台,作为公司的核心技术平台,致力于“零售+科技”的战略发展。我们专注于智能体构建、大模型推理、多模态训练等核心技术,并通过FRIDAY模型工厂与应用工厂,为业务提供稳定、安全、易扩展与技术先进的平台技术和技术能力。我们聚焦于大模型和智能体的前沿算法研究和应用落地,致力于将先进的人工智能技术转化为实际的业务价值。 我们真诚邀请你加入我们,共同推动技术发展,创造行业价值。 1. 负责基于大模型在业务场景下关键能力的应用研发,包括基于大模型的BI数据、商家助手、多智能体等; 2. 深入理解本地生活服务业务场景,研究并优化大模型推理、规划、代码等能力,推动相关技术在实际业务中的应用; 3. 研发和优化智能体、多智能协作,使其能够高效、准确地调用内部和外部工具,扩展智能体的应用边界; 4. 结合自主Agent的理念,探索和优化模型的能力边界,推动模型在复杂任务上的表现; 5. 跟进人工智能领域的新技术,探索前沿大模型技术方案和相关技术的验证,并撰写相论文和专利。

更新于 2025-05-09