logo of mihoyo

米哈游Agent 算法研究员

实习兼职程序&技术类地点:上海状态:招聘

任职要求


1)硕士及以上学历,计算机科学、人工智能、机器学习自然语言处理数据科学或相关专业,优秀本科生亦可
对大模型Agent强化学习、对话系统或游戏 AI 方向有浓厚兴趣,具备相关科研、实习或项目经验
2)熟悉 Transformer 等基础模型原理,了解 LLM / VLM / 多模态模型及其在推理、规划、记忆、工具调用等方向的典型应用
3)熟练使用 Python,具备良好的代码能力与算法基础,熟悉 PyTorch 及常用深度学习开发流程
4)了解 SFT、DPO、RLHF、RLAIF、PPO、GRPO 等大模型对齐或强化学习方法中的一种或多种,有实际项目经验者优先
1)了解 Agent 常见技术范式,如 ReAct、Function Calling、RAG、Memory、Planning、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1)Agent 能力研发:参与 AI Native 游戏场景下智能体(Agent)核心能力研发,覆盖智能 AI NPC、AI 叙事、AI 玩法等方向,探索多轮对话、任务规划、工具调用、环境交互、长期记忆与自主决策等能力建设
2)Agent 架构实现:参与游戏场景下 Agent 核心模块的设计与开发,包括 Planning、Memory、Tool Use、Action、Reflection、Persona、State Tracking 等,协助提升智能体在复杂动态环境中的稳定性、一致性与可控性
3)训练与对齐优化:参与 Agent 相关模型与策略优化工作,包括 SFT、DPO、RLHF/RLAIF、PPO/GRPO 等方法的实现、复现与改进,提升智能体在角色扮演、剧情推进、任务执行等场景中的效果
4)记忆与数据建设:参与适用于游戏场景的 Agent Memory 体系和数据闭环建设,支持 NPC 对玩家行为、剧情进展、任务状态和角色关系等信息的记忆、检索与应用
5)工具调用与评测体系:参与 Agent 工具调用链路、环境交互机制及评测体系建设,围绕任务完成、角色一致性、叙事合理性、工具调用效果、安全性等维度进行实验与分析
前沿方向探索:跟踪 Agent、Multi-Agent、GUI Agent、Browser Agent、World Model、MCP、Agent Eval 等前沿技术进展,结合游戏业务进行技术预研、方案验证与创新尝试
包括英文材料
学历+
机器学习+
NLP+
数据科学+
大模型+
AI agent+
强化学习+
Transformer+
还有更多 •••
相关职位

logo of ke
社招5年以上用户技术中心

岗位职责: 1、负责 AI Agent 系统的设计、开发和优化、开发和完善基于大语言模型 (LLM) 的智能体系统,提升 Agent 的自主决策和任务执行能力; 2、负责生成式大模型指令意图理解相关工作,整体提升大模型的多轮对话指令理解能力和性能; 3、设计并实现 Agent 的工具使用接口,实现与各类外部系统和 API 的集成编排; 4、负责大模型在检索、推荐方面的系统设计实现和优化,探索Agent、RAG、领域模型调优等相关技术在业务场景落地; 5、具备模型知识、幻觉机制探究,提升模型知识水平、降低模型幻觉率; 6、能够基于开源模型,设计和开发算法,对模型进行微调,优化其参数和结构,以提高模型的泛化能力和准确性; 7、深入调研AI领域相关的前沿技术,跟踪业内大模型领域的最新进展,并寻求将最新技术应用到产品的可能性。

更新于 2025-04-02北京
logo of ke
社招3年以上质量架构部

1.参与基于多模态大模型的GUI智能化能力的设计开发,实现多端(web/安卓/ios/鸿蒙/小程序)大模型手眼配套能力全覆盖; 2.跟踪业界前沿技术发展,参与大模型应用评测、企业内部场景化落地、GUI智能体建设等;

更新于 2025-03-27北京
logo of ctrip
社招5年以上住宿业务AI &

我们正在寻找一位具有AI智能化及内容算法经验的算法团队负责人。负责领导团队开发前沿技术,推动旅游领域知识的构建,支持内容产品的分发和AI Agent结合的创新应用探索,提升公司产品的智能化水平。 : 领导并管理内容算法团队,制定技术战略和发展方向,推动知识构建、知识编译、知识分发、探索LLM等创新NLP技术与Agent业务的结合。 1、负责基础NLP相关算法研发,面向但不限于:预训练,文本理解,同义词挖掘,实体识别,term权重分析,属性词挖掘 2、结合NLP和深度学习技术,推动领域知识的构建与优化,制定各环节Benchmark及衡量标准, 跟进业界先进大模型、多模态技术的应用及改进 3、发现并解决推荐分发场景中的意图识别、排序模型、相关性等方向的问题,召回策略和召回模型的优化,开发先进和高性能的召回算法 4、与产品、数据、工程等跨职能团队协作,推动技术落地和产品迭代。 5、负责团队成员的技术指导和能力提升,推动团队技术文化的建设。

更新于 2025-04-01上海
logo of baidu
社招3年以上ACG

-负责大模型应用开发平台的算法设计与优化,提升开发者在平台上的体验与应用效率 -研究并应用前沿的深度学习和机器学习算法,推动大模型在实际业务场景中的应用落地,重点关注RAG、Agent、工作流等能力方向 -深入掌握Function Call,代码解释器,Post-training等原理及常用方法 -与产品、工程团队紧密合作,理解业务需求,制定相应的算法解决方案 -持续优化算法的效率和效果,确保平台的高性能和高可用性

更新于 2025-03-27北京