腾讯腾讯游戏-AI算法研究员-LLM/强化学习方向(新星引力计划)
社招全职1年以上IEG技术地点:深圳状态:招聘
任职要求
1.硕士及以上学历,计算机、机器学习或数学等相关专业,1-3年大模型领域相关工作经验; 2.掌握机器学习、强化学习、大模型等算法原理,包括预训练、SFT、RLHF/DPO/PPO等,并有强化学习相关项目的深入落地应用经验; 3.持续关注AI前沿技术动态,具备优秀的团队协作与沟通能力,能快速推动技术方案的场景适配与落地验证。 加分项 1.在NeurIPS、ACL、ICML、ICLR、EMNLP、NAACL等顶会发表高质量论文者优先; 2.有大语言模型应用经验优先,包括精调(SFT)、强化(DPO, PPO,GRPO) 等技术的落地。
工作职责
1.负责基于LLM的智能体算法在游戏NPC、AI BOT等场景中的应用; 2.负责LLM训练算法(SFT、RL)、训练数据合成、自动评测相关算法研究,提升LLM在复杂游戏场景的多轮对话、推理规划能力; 3.负责基于LLM的检索增强(RAG)、多智能体协作算法研究,并推动其在游戏内相关场景落地; 4.探索前沿技术,提高强化学习效率和效果,结合游戏场景进行应用。
包括英文材料
学历+
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
NeurIPS+
https://neurips.cc/
ICML+
https://icml.cc/
ICLR+
https://iclr.cc/
相关职位
校招人工智能
1. 接触到游戏界最前沿的AI技术问题,充分施展才能来挑战业界难题,在MMORPG、FPS、Sports、Battle Royale等类型的游戏中实现人工智能技术的落地,创造业务价值; 2. 深入研究决策智能、语言智能等方向的前沿课题,如:VLM/LLM Agent,World Model、RLHF等,研发新技术以应对未来业务挑战; 3. 从事游戏相关的深度学习、强化学习等算法框架研发工作,开发业内领先的工程框架。
实习人工智能
你可以: 1. 接触到游戏界最前沿的AI技术问题,充分施展才能来挑战业界难题,在MMORPG、FPS、Sports、Battle Royale等丰富类型的游戏中实现人工智能技术的落地; 2. 从事游戏相关的深度学习、强化学习等算法框架研发工作,开发业内领先的工程框架; 3. 和研究员一同深入研究决策智能、语言智能等方向的前沿课题,如:World Model、RLHF、LLM Agent,并发表高质量的文章或撰写专利。
社招IEG技术
1.负责基于LLM的智能体算法在游戏NPC、知识问答、陪玩等场景中的应用; 2.负责LLM训练算法(SFT、RL)、训练数据合成、自动评测相关算法研究,提升LLM在复杂游戏场景的多轮对话、推理规划能力; 3.负责基于LLM的检索增强(RAG)、多智能体协作算法研究,并推动其在游戏内相关场景落地。
更新于 2025-04-29