米哈游【提前批】LLM研究员（post-train）

校招全职程序&技术类地点：上海状态：招聘

扫码手机上打开

任职要求

1、计算机科学、人工智能或相关领域的硕士或博士学历，或具有等同的研究经历 
2、在自然语言处理、大语言模型研究或机器学习领域中具有丰富的经验 
3、具备扎实的代码与算法基础，熟练掌握PyTorch等深度学习框架 
4、具备有效的沟通和协作技能，对探索新技术和推动技术创新充满热情

加分项
1、在NeurIPS/ICML/ACL/EMNLP等顶级会…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、紧跟领域前沿技术，探索有效和高效的 RLHF 或 RLAIF 等post-training方法，提升大语言模型的拟人化、趣味性, 以及角色扮演、创意写作等方向的综合能力 
2、参与预研项目的研发，与产品、策划、工程等多个团队紧密协作，拆解并设计具体的算法解决方案和交付目标 
3、构建高质量、多领域的数据处理及分析流程，包括但不限于数据清洗、数据合成、数据混合策略等 
4、构建稳健可靠的算法评估流程，揭示大语言模型能力边界和潜在机制

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

NLP+

机器学习+

算法+

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

【提前批】LLM研究员(pretrain modeling)

校招程序&技术类

1、专研训练框架，快速定位训练中出现的问题，分析训练过程中的模型表现，跟infra team合作来保证训练策略的正确性 2、紧跟领域前沿技术，研究新型LLM模型架构，提升训练或推理的计算效率和模型性能 3、研究不同架构、数据、目标函数和优化方法等各个算法方面的scaling law，总结出高效稳定的预训练策略 4、拓展模型在长文本理解和生成的能力

上海

【提前批】LLM研究员 (Eval /RM)

校招程序&技术类

LLM 中文eval 跟reward modeling

上海

【提前批】LLM研究员（agent&memory）

校招程序&技术类

1、紧跟领域前沿技术，搭建一致、拟人、高智商、高情商的AI角色 2、持续迭代 Memory、Planning、RAG、Tool use、Multi-Agent等关键技术，提升Agent的对话管理、行为决策与环境交互能力 3、研发高效的Agent系统，持续优化架构与性能，推动Agent在产品化应用中的落地 4、探索并实现复杂场景下的Agent数据闭环，构建稳健、可靠的评估流程

上海

【提前批】AI Native游戏LLM研究员

校招程序&技术类

1、探索大模型及Agent技术在游戏领域的前沿应用，包括不限于智能NPC、AI交互叙事、AIGC游戏内容生成管线研发； 2、优化和提升游戏场景下的模型效果：SFT/RLHF训练策略、Reward Model、记忆系统、Agent架构； 3、预研大模型驱动的AI Native游戏玩法、提升游戏体验、确保内容可控性和实时推理性能等。

北京