米哈游Agent 算法工程师 - Varsapura

社招全职2年以上程序&技术类地点：上海 | 北京状态：招聘

扫码手机上打开

任职要求

1）硕士及以上学历，计算机科学、人工智能、机器学习、自然语言处理或相关专业
2）2 年以上大模型应用、Agent 系统、NLP 算法或强化学习相关经验，有完整项目研发和落地经验
3）熟悉 LLM / VLM / 多模态模型的基础原理及应用方式，理解 Agent 系统中的规划、记忆、工具调用、上下文管理与多步推理等关键问题
4）熟练使用 PyTorch 及主流大模型训练/推理框架与工具链，如 Transformers、DeepSpeed、Megatron-LM、VeRL、vLLM、SGLang 等，具备较强的工程实现能力
5）具备 Agent 方向的实际研发经验，熟悉 ReAct、Function Calling、RAG、Memory、Reflection、Planning、Multi-Agent 等常见范式，能够独立设计并实现复杂 Agent 工作流
6）具备扎实的强化学习或对齐基础，理解 SFT、DPO、RLHF、RLAIF、PPO、GRPO 等方法原理，有将相关方法应用于大模型行为优化或 Agent 系统优化的实践经验
7）具备良好的系统设计与问题分…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1）Agent 能力研发：面向 AI Native 游戏场景，负责智能体（Agent）核心能力研发与优化，覆盖智能 AI NPC、AI 叙事、AI 玩法等方向，构建具备多轮对话、任务规划、工具调用、环境交互、长期记忆与自主决策能力的 Agent 系统
2）Agent 架构设计：设计并实现游戏场景下的 Agent 核心架构，包括 Planning、Memory、Tool Use、Action、Reflection、Persona、State Tracking 等模块，提升智能体在复杂动态环境中的稳定性、一致性与可控性
3）训练与对齐优化：结合业务需求，参与 Agent 相关模型与策略优化，包括 SFT、DPO、RLHF/RLAIF、PPO/GRPO 等方法，提升智能体在角色一致性、任务完成率、对话连贯性、行为合理性和安全性等维度的表现
4）记忆与数据体系建设：构建适用于游戏场景的 Agent Memory 与数据闭环体系，支持 NPC 对玩家历史行为、剧情进展、任务状态、角色关系和世界知识的长期记忆与高效调用，并持续优化训练数据与交互数据质量
5）工具调用与环境交互：建设 Agent 的工具与动作能力，使其能够可靠调用游戏内外部系统能力，如任务系统、剧情系统、检索系统、脚本/代码执行、UI/Browser 自动化等，提升 Agent 在真实业务场景中的执行能力
6）评测体系与系统优化：建立面向 Agent 的评测体系，围绕任务完成、角色设定一致性、叙事合理性、工具调用成功率、长期记忆效果、安全性等维度设计 Eval、自动化测试与分析机制，推动模型与系统持续迭代
7）多 Agent 与前沿探索：探索 Multi-Agent、GUI Agent、Browser Agent、World Model、MCP 等前沿方向在游戏中的应用，与产品、策划、工程团队协同推进 Agent 能力的落地与创新

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

机器学习+

NLP+

大模型+

AI agent+

算法+

强化学习+

PyTorch+

vLLM+

SGLang+

还有更多 •••

登录查看完整学习资料