网易强化学习算法工程师
社招全职1年以上网易伏羲地点:杭州状态:招聘
任职要求
1、计算机、数学、人工智能、自动化、控制等相关专业硕士及以上学历; 2、1年以上相关工作经验,包括但不限于使用强化学习、模仿学习、LLM等相关技术,参与游戏AI、无人驾驶等决策控制类业务;有FPS游戏相关项目经验者优先; 3、对编程语言…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、对接游戏项目需求,负责技术方案的设计和实现,不断迭代和优化项目效果; 2、持续改进算法和框架,开发和完善通用框架和SDK工具,提升游戏AI开发效率。
包括英文材料
学历+
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C#+
https://learn.microsoft.com/en-us/dotnet/csharp/
The C# guide contains articles, tutorials, and code samples to help you get started with C# and the .NET platform.
还有更多 •••
相关职位
社招核心本地商业-业
1. 负责强化学习算法的研究、开发和应用,解决AI搜索等实际问题并提升业务效果。 2. 设计、实现、优化强化学习模型,包括但不限于价值迭代、策略梯度、模型预测控制等算法。 3. 跟踪强化学习领域的前沿研究进展,不断探索和创新,推动强化技术发展。 4. 与LLM的模型后训练相结合,迭代RL训练技术并实现业务模型的调优和落地。
更新于 2025-04-22北京|上海
社招A30179A
1、负责强化学习算法的开发和应用,用于机器人的精细操作或者全身运动控制,提升动作的自然度和鲁棒性; 2、完成控制策略在真机上的测试验证,重点解决部署过程中遇到的sim2real gap问题; 3、持续跟踪国内外前沿研究成果,并进行相关算法复现。
更新于 2025-05-06北京
社招
1. 开展机器学习和强化学习领域的科学研究,推动技术进步; 2. 开发更优的数据驱动人类行为建模方法; 3. 与研究人员及跨职能团队合作,沟通研究计划、进展与成果; 4. 应用前沿强化学习技术,推动生成式人工智能(GenAI)和具身智能应用落地。 5. 参与学术论文发表及开源项目贡献。
更新于 2025-04-28深圳|上海