米哈游【提前批】RL算法工程师

校招全职程序&技术类地点：上海状态：招聘

扫码手机上打开

任职要求

1、硕士及以上学历，计算机、数学、人工智能等相关专业，扎实的深度强化学习技术积累；
2、熟练使用Tensorflow/Pytorch等至少…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责游戏AI深度强化学习算法设计，提供解决方案等；
2、负责游戏AI前沿算法的研究和开发，包括特征工程，模型训练，效果优化，RL分布式框架等。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

强化学习+

还有更多 •••

登录查看完整学习资料

相关职位

算法工程师-大模型训练（T-Star Lab 2026届实习）

实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目，继承“阿里星〞的使命与愿景，面向全球招募顶尖技术人才。首次开设实习生专项招聘，面向2025年10月后毕业的校优秀技术同学。期待你们在淘天，通过极具挑战的前沿课题与亿级规模的海量数据、应用场景，探索和实践最前沿的Al技术，在有价值的业务场景落地技术成果。你的挑战：攻克LLM全链路训练难题：主导大模型训练，优化模型Scaling Law，结合应用需求突破分布式性能瓶颈，基于RL增强模型推理能力，打造电商领域最懂用户需求的超级大脑（含多模态VLM研发）。为什么选择淘天？ 1.坐拥电商领域最大规模场景：每天处理数亿次用户交互，覆盖搜索/推荐/广告/客服/营销全链路，你将直接面对全球最复杂的电商需求场景。 2.定义未来购物标准：你研发的模型将服务数亿消费者，结合大语言和多模态模型能力满足用户偏好，影响海量商家经营决策。 3.顶级科研配置：超大规模GPU集群支持大规模参数模型训练，自研分布式框架实现训练推理效率大幅提升，顶级会议发表，前沿技术成果即时输血。加入我们，你将获得： 1.与NLP/多模态领域顶尖团队共创，解锁大模型在商品理解、智能创作、消费决策、购物对话等场景的无限可能。 2.弹性化的技术路线选择权，既可在大模型基础技术方面突破能力上限，也可深入应用层打造现象级AI产品。 3.打通产学研用全链路：支持技术成果转化顶会论文和专利+百万级ai native用户产品。 T-Star实习可以带给你什么？ ꔷ ①加入前沿技术探索队伍，参与顶级课题研究，有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生，提前解锁淘天顶级技术岗位，实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时，将获得直通正式批次终面的机会；参与T-Star实习且表现优秀的同学，提供T-Star转正Offer。

更新于 2025-05-07北京|杭州

高级/资深游戏测试开发工程师（AI方向）

社招网易伏羲

1. 参与网易伏羲游戏AI产品的质量保障，包括AIGC、自然语言、用户画像、强化学习等算法测试和性能测试； 2.对产品需求进行分析、评审，提前规避有问题需求，设计测试点、测试用例；积极发现和推动解决项目中的进度、流程、质量风险，并能对项目提出合理建议； 3. 挖掘研发和测试过程中的痛点，通过开发测试平台、工具的等方式来提升研发的质量和效率； 4. 对前沿测试技术有较高的敏感度，思考AI在测试领域的应用，能够引入并应用到工作中。

更新于 2025-04-03杭州

高级研发工程师(J250416019)

社招1年以上技术

1、负责滴滴国际化外卖营销方向的需求开发，在充分理解营销业务的基础上进行需求分析、设计、开发、上线等工作； 2、负责相关核心微服务的设计和实现，充分理解业务的发展方向和未来的技术挑战，并作出提前设计和规划； 3、学习研究业界先进技术，保持技术进步。

更新于 2025-04-16北京

AI与3D硬件经理PMO(J65429)

社招5年以上XYZ

负责AI眼镜、3D扫描重建设备、MR头显等潜在多款硬件产品研发项目全流程推进，确保项目按时保质交付。深度对接与管理外部供应商，高质量高效率推进供应商筛选、评估与谈判，建立稳定紧密的联合研发合作。协调内外部跨部门团队协作，包括硬件/软件/测试/工业设计/市场及售后等部门，精准将产品需求推动落地。提前识别项目中技术/供应链/量产/市场及法规等多类风险，运用专业工具评估影响，制定并执行应对策略。收集与分析项目关键数据，如进度/成本/质量/供应商绩效等，为项目决策和资源配置提供科学依据和有力支撑。

更新于 2024-12-24北京