logo of netease

网易游戏AI研究员 / 大模型Agent工程师 (开放世界方向)

社招全职3年以下网易游戏(雷火)地点:杭州状态:招聘

任职要求


职位要求:
1、教育背景与经验:
计算机科学、人工智能或相关专业硕士及以上学历;
具备2年及以上相关领域工作经验(人工智能、游戏AI、大模型、智能体方向优先);
或优秀应届博士毕业生(研究方向匹配者优先)。
2、理论基础与研究能力:
深入理解机器学习强化学习深度学习算法的原理及其在互联网/游戏行业的应用;
对前沿AI技术有浓厚兴趣,具备扎实的研究能力;
加分项: 在NeurIPSICMLICLR、AAAI等顶级AI会议上发表过论文。
3、大模型与数据工程:
熟悉业界领先大语言模型(如Qwen、Deepseek、Claude、Gemini系列等)的基本原理、…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


业务场景:
在开放世界游戏环境中,进行游戏内容理解与动态解说,驱动智能体完成指定任务、实现自主探索,并支持多智能体复杂交互等前沿AI应用场景。

岗位职责:
研究与开发:
 负责开放世界游戏场景下基于大语言模型(LLM)及视觉语言模型(VLM)的智能体(Agent)技术研究与开发,涵盖Prompt工程、上下文学习(ICL)、检索增强生成(RAG)、监督微调(SFT)、强化微调(RFT)等关键技术。
框架与工具链构建:
 主导游戏智能体核心框架的设计与实现,推动训练数据合成、自动化评测体系及相关算法的研发。
工业化落地:
 推动游戏智能体技术在游戏内容生产与玩家消费场景的工业化部署与产品化落地,实现技术价值转化。
包括英文材料
学历+
大模型+
机器学习+
强化学习+
深度学习+
算法+
NeurIPS+
ICML+
还有更多 •••
相关职位

logo of mihoyo
实习程序&技术类

1)Agent 能力研发:参与 AI Native 游戏场景下智能体(Agent)核心能力研发,覆盖智能 AI NPC、AI 叙事、AI 玩法等方向,探索多轮对话、任务规划、工具调用、环境交互、长期记忆与自主决策等能力建设 2)Agent 架构实现:参与游戏场景下 Agent 核心模块的设计与开发,包括 Planning、Memory、Tool Use、Action、Reflection、Persona、State Tracking 等,协助提升智能体在复杂动态环境中的稳定性、一致性与可控性 3)训练与对齐优化:参与 Agent 相关模型与策略优化工作,包括 SFT、DPO、RLHF/RLAIF、PPO/GRPO 等方法的实现、复现与改进,提升智能体在角色扮演、剧情推进、任务执行等场景中的效果 4)记忆与数据建设:参与适用于游戏场景的 Agent Memory 体系和数据闭环建设,支持 NPC 对玩家行为、剧情进展、任务状态和角色关系等信息的记忆、检索与应用 5)工具调用与评测体系:参与 Agent 工具调用链路、环境交互机制及评测体系建设,围绕任务完成、角色一致性、叙事合理性、工具调用效果、安全性等维度进行实验与分析 前沿方向探索:跟踪 Agent、Multi-Agent、GUI Agent、Browser Agent、World Model、MCP、Agent Eval 等前沿技术进展,结合游戏业务进行技术预研、方案验证与创新尝试

上海
logo of tencent
社招1年以上IEG技术

1.结合游戏平台业务垂直场景,负责深度学习,大语言模型的训练精调、调优及部署,及智能体Agent开发; 2.参与大规模平台用户行为数据集的ETL及特征工程,构建高效数据流水线,落地到用户画像体系; 3.跟踪和研究前沿AI技术(如BERT、LLM、Diffusion、RAG,MCP,A2A,ASR等),推动技术落地业务发挥价值; 4.与技术团队协作,优化算法模型和服务性能,满足产品AI价值落地。

更新于 2025-08-04深圳
logo of tencent
社招1年以上公共技术

1.结合游戏平台业务垂直场景,负责深度学习和大语言模型的训练精调、调优及部署,及智能体Agent开发; 2.参与大规模平台用户行为数据集的ETL及特征工程,构建高效数据流水线,落地到用户画像体系并服务到线上AI应用; 3.跟踪和研究前沿AI技术(如LLM、VLM、SFT、DPO、RAG、MCP等),推动技术落地业务发挥价值; 4.与技术团队协作,优化算法模型和服务性能,满足产品AI价值落地要求。

更新于 2026-02-05深圳
logo of sensetime
校招算法研究类

工作职责【岗位职责】 你将有机会参与以下一个或多个前沿方向的研究与开发: 多模态统一模型: 参与多模态大模型(文本、语音、图像等)的前沿研究,探索生成与理解任务的统一框架,以及高效的多模态联合学习方法。 个性化对话系统: 设计并实现更具“人性”的对话系统,重点攻克长期记忆、持续学习和情境感知等关键技术,让AI能够记住与你的每一次互动。 强化学习与交互策略: 将强化学习(RL)算法创新性地应用于语音/音频相关的多模态任务中,通过与环境或用户的交互,自主优化AI的决策与沟通策略。 语音智能体(Voice Agent): 参与构建具备主动交互与复杂任务规划能力的语音Agent,使其不仅能“听懂”,更能“思考”和“行动”,完成多轮、跨领域的复杂指令。 前沿技术探索: 跟踪NeurIPS, ICML, ICLR, ACL等顶会的前沿进展,快速复现、验证并改进相关算法,推动技术落地

更新于 2025-08-21上海