logo of tencent

腾讯腾讯游戏-AI算法研究员-LLM/强化学习方向(新星引力计划)

社招全职1年以上IEG技术地点:深圳状态:招聘

任职要求


1.硕士及以上学历,计算机、机器学习或数学等相关专业,1-3年大模型领域相关工作经验;
2.掌握机器学习强化学习大模型算法原理,包括预训练、SFT、RLHF/DPO/PPO等,并有强化学习相关项目的深入落地应用经验;
3.持续关注AI前沿技术动态,具备优秀的团队协作与沟通能力,能快速推动技术方案的场景适配与落地验证。

加分项
1.在NeurIPS、ACL、ICMLICLR、EMNLP、NAACL等顶会发表高质量论文者优先;
2.有大语言模型应用经验优先,包括精调(SFT)、强化(DPO, PPO,GRPO) 等技术的落地。

工作职责


1.负责基于LLM的智能体算法在游戏NPC、AI BOT等场景中的应用;
2.负责LLM训练算法(SFT、RL)、训练数据合成、自动评测相关算法研究,提升LLM在复杂游戏场景的多轮对话、推理规划能力;
3.负责基于LLM的检索增强(RAG)、多智能体协作算法研究,并推动其在游戏内相关场景落地;
4.探索前沿技术,提高强化学习效率和效果,结合游戏场景进行应用。
包括英文材料
学历+
机器学习+
大模型+
强化学习+
算法+
SFT+
NeurIPS+
ICML+
相关职位

logo of netease
校招人工智能

1. 接触到游戏界最前沿的AI技术问题,充分施展才能来挑战业界难题,在MMORPG、FPS、Sports、Battle Royale等类型的游戏中实现人工智能技术的落地,创造业务价值; 2. 深入研究决策智能、语言智能等方向的前沿课题,如:VLM/LLM Agent,World Model、RLHF等,研发新技术以应对未来业务挑战; 3. 从事游戏相关的深度学习、强化学习等算法框架研发工作,开发业内领先的工程框架。

logo of netease
实习人工智能

你可以: 1. 接触到游戏界最前沿的AI技术问题,充分施展才能来挑战业界难题,在MMORPG、FPS、Sports、Battle Royale等丰富类型的游戏中实现人工智能技术的落地; 2. 从事游戏相关的深度学习、强化学习等算法框架研发工作,开发业内领先的工程框架; 3. 和研究员一同深入研究决策智能、语言智能等方向的前沿课题,如:World Model、RLHF、LLM Agent,并发表高质量的文章或撰写专利。

logo of tencent
社招IEG技术

1.负责基于LLM的智能体算法在游戏NPC、知识问答、陪玩等场景中的应用; 2.负责LLM训练算法(SFT、RL)、训练数据合成、自动评测相关算法研究,提升LLM在复杂游戏场景的多轮对话、推理规划能力; 3.负责基于LLM的检索增强(RAG)、多智能体协作算法研究,并推动其在游戏内相关场景落地。

更新于 2025-04-29
logo of tencent
社招CSIG技术

1.负责AI搜索、大模型对话等场景中AI Agent方向的算法研究,提升大模型逻辑推理和任务规划能力; 2.优化Agent的工具调用、记忆管理能力,解决AI搜索下多卡片、多API的调用精度,提升与环境的交互能力; 3.优化Agent上下文理解能力,解决查询意图、查询拆解、问题补全等实际问题; 4.LLM相关的算法探索与落地工作,包括不限于RAG、SFT+强化学习、Multi-Agent等前沿方向。

更新于 2025-06-17