米哈游Agent 算法研究员
任职要求
1)硕士及以上学历,计算机科学、人工智能、机器学习、自然语言处理、数据科学或相关专业,优秀本科生亦可 对大模型、Agent、强化学习、对话系统或游戏 AI 方向有浓厚兴趣,具备相关科研、实习或项目经验 2)熟悉 Transformer 等基础模型原理,了解 LLM / VLM / 多模态模型及其在推理、规划、记忆、工具调用等方向的典型应用 3)熟练使用 Python,具备良好的代码能力与算法基础,熟悉 PyTorch 及常用深度学习开发流程 4)了解 SFT、DPO、RLHF、RLAIF、PPO、GRPO 等大模型对齐或强化学习方法中的一种或多种,有实际项目经验者优先 1)了解 Agent 常见技术范式,如 ReAct、Function Calling、RAG、Memory、Planning、…
工作职责
1)Agent 能力研发:参与 AI Native 游戏场景下智能体(Agent)核心能力研发,覆盖智能 AI NPC、AI 叙事、AI 玩法等方向,探索多轮对话、任务规划、工具调用、环境交互、长期记忆与自主决策等能力建设 2)Agent 架构实现:参与游戏场景下 Agent 核心模块的设计与开发,包括 Planning、Memory、Tool Use、Action、Reflection、Persona、State Tracking 等,协助提升智能体在复杂动态环境中的稳定性、一致性与可控性 3)训练与对齐优化:参与 Agent 相关模型与策略优化工作,包括 SFT、DPO、RLHF/RLAIF、PPO/GRPO 等方法的实现、复现与改进,提升智能体在角色扮演、剧情推进、任务执行等场景中的效果 4)记忆与数据建设:参与适用于游戏场景的 Agent Memory 体系和数据闭环建设,支持 NPC 对玩家行为、剧情进展、任务状态和角色关系等信息的记忆、检索与应用 5)工具调用与评测体系:参与 Agent 工具调用链路、环境交互机制及评测体系建设,围绕任务完成、角色一致性、叙事合理性、工具调用效果、安全性等维度进行实验与分析 前沿方向探索:跟踪 Agent、Multi-Agent、GUI Agent、Browser Agent、World Model、MCP、Agent Eval 等前沿技术进展,结合游戏业务进行技术预研、方案验证与创新尝试
岗位职责: 1、负责 AI Agent 系统的设计、开发和优化、开发和完善基于大语言模型 (LLM) 的智能体系统,提升 Agent 的自主决策和任务执行能力; 2、负责生成式大模型指令意图理解相关工作,整体提升大模型的多轮对话指令理解能力和性能; 3、设计并实现 Agent 的工具使用接口,实现与各类外部系统和 API 的集成编排; 4、负责大模型在检索、推荐方面的系统设计实现和优化,探索Agent、RAG、领域模型调优等相关技术在业务场景落地; 5、具备模型知识、幻觉机制探究,提升模型知识水平、降低模型幻觉率; 6、能够基于开源模型,设计和开发算法,对模型进行微调,优化其参数和结构,以提高模型的泛化能力和准确性; 7、深入调研AI领域相关的前沿技术,跟踪业内大模型领域的最新进展,并寻求将最新技术应用到产品的可能性。
1.参与基于多模态大模型的GUI智能化能力的设计开发,实现多端(web/安卓/ios/鸿蒙/小程序)大模型手眼配套能力全覆盖; 2.跟踪业界前沿技术发展,参与大模型应用评测、企业内部场景化落地、GUI智能体建设等;
我们正在寻找一位具有AI智能化及内容算法经验的算法团队负责人。负责领导团队开发前沿技术,推动旅游领域知识的构建,支持内容产品的分发和AI Agent结合的创新应用探索,提升公司产品的智能化水平。 : 领导并管理内容算法团队,制定技术战略和发展方向,推动知识构建、知识编译、知识分发、探索LLM等创新NLP技术与Agent业务的结合。 1、负责基础NLP相关算法研发,面向但不限于:预训练,文本理解,同义词挖掘,实体识别,term权重分析,属性词挖掘 2、结合NLP和深度学习技术,推动领域知识的构建与优化,制定各环节Benchmark及衡量标准, 跟进业界先进大模型、多模态技术的应用及改进 3、发现并解决推荐分发场景中的意图识别、排序模型、相关性等方向的问题,召回策略和召回模型的优化,开发先进和高性能的召回算法 4、与产品、数据、工程等跨职能团队协作,推动技术落地和产品迭代。 5、负责团队成员的技术指导和能力提升,推动团队技术文化的建设。