logo of netease

网易强化学习算法工程师

社招全职1年以上网易伏羲地点:杭州状态:招聘

任职要求


1、计算机、数学、人工智能、自动化、控制等相关专业硕士及以上学历;
2、1年以上相关工作经验,包括但不限于使用强化学习、模仿学习、LLM等相关技术,参与游戏AI、无人驾驶等决策控制类业务;有FPS游戏相关项目经验者优先;
3、对编程语言的熟练程度要求: Python > C# == Lua > C++;能够熟练使用TensorflowPytorch中的任意一种深度学习框架;熟悉或使用过Ray等分布式训练框架,进行大规模分布式训练;
4、热爱游戏、重度游戏爱好者优先。

工作职责


1、对接游戏项目需求,负责技术方案的设计和实现,不断迭代和优化项目效果;
2、持续改进算法和框架,开发和完善通用框架和SDK工具,提升游戏AI开发效率。
包括英文材料
学历+
强化学习+
大模型+
Python+
C#+
Lua+
C+++
TensorFlow+
PyTorch+
深度学习+
Ray+
相关职位

logo of meituan
社招核心本地商业-业

1. 负责强化学习算法的研究、开发和应用,解决AI搜索等实际问题并提升业务效果。 2. 设计、实现、优化强化学习模型,包括但不限于价值迭代、策略梯度、模型预测控制等算法。 3. 跟踪强化学习领域的前沿研究进展,不断探索和创新,推动强化技术发展。 4. 与LLM的模型后训练相结合,迭代RL训练技术并实现业务模型的调优和落地。

更新于 2025-04-22
logo of mi
社招A30179A

1、负责强化学习算法的开发和应用,用于机器人的精细操作或者全身运动控制,提升动作的自然度和鲁棒性; 2、完成控制策略在真机上的测试验证,重点解决部署过程中遇到的sim2real gap问题; 3、持续跟踪国内外前沿研究成果,并进行相关算法复现。

更新于 2025-05-06
logo of xpeng
社招

1. 开展机器学习和强化学习领域的科学研究,推动技术进步; 2. 开发更优的数据驱动人类行为建模方法; 3. 与研究人员及跨职能团队合作,沟通研究计划、进展与成果; 4. 应用前沿强化学习技术,推动生成式人工智能(GenAI)和具身智能应用落地。 5. 参与学术论文发表及开源项目贡献。

更新于 2025-04-28
logo of bytedance
社招A76234

1、深入研究和应用COT及强化学习技术,建立针对电商大模型推理优化体系,使模型在处理电商复杂问题的准确率显著提升,显著增强模型的动态推理和反思能力,确保模型能够快速、准确地应对电商业务的高复杂度和多变性需求; 2、研发的电商推理优化大模型支持核心电商业务场景(如审核、商品推荐),降低人工审核成本,提升电商业务的智能化水平和运营效率; 3、研究大模型驱动的智能体算法,包括但是不局限于ReACT、Voyager、WebGPT、AutoGPT; 4、撰写技术报告和论文,分享研究成果,参与内外部的技术交流和合作,推动团队技术水平的提升,提高团队在行业内的影响力。

更新于 2025-03-20