logo of mihoyo

米哈游【提前批】LLM研究员 (agent&memory)

校招全职程序&技术类地点:上海状态:招聘

任职要求


1、计算机科学、人工智能或相关领域的博士学历,或具有等同的研究经历 

2、在自然语言处理、大语言模型研究或机器学习领域中具有丰富的经验 

3、具备扎实的代码与算法基础,熟练掌握PyTorch深度学习框架 

4、具备有效的沟通和协作技能,对探索新技术和推动技术创新充满热情

加分项
1、在NeurIPS/ICML/ACL/EMNLP等顶级会议上发表过高引论文 

2、在ACM/ICPC,NOI/IOI,TopCoder等大赛上有获奖 

3、主导过有影响力的LLM应用项目,或有丰富的技术落地经验 

4、熟悉RL和Agent框架,具备利用Agent系统解决复杂任务的实践经验

工作职责


1、紧跟领域前沿技术,搭建一致、拟人、高智商、高情商的AI角色 

2、持续迭代 Memory、Planning、RAG、Tool use、Multi-Agent等关键技术,提升Agent的对话管理、行为决策与环境交互能力 

3、研发高效的Agent系统,持续优化架构与性能,推动Agent在产品化应用中的落地 

4、探索并实现复杂场景下的Agent数据闭环,构建稳健、可靠的评估流程
包括英文材料
学历+
NLP+
机器学习+
算法+
PyTorch+
深度学习+
NeurIPS+
ICML+
大模型+
AI agent+
相关职位

logo of mihoyo
校招程序&技术类

1、研究LLM后训练算法,探索LLM Agent在游戏场景中的落地应用,包括在游戏设计、玩法以及研发管线中的应用等; 2、针对各应用场景,收集LLM后训练数据,制定数据流转pipeline,参与构建后训练数据飞轮; 3、研究LLM模型的后训练策略,使用强化学习等技术提升LLM Agent的性能,参与游戏领域LLM模型的调优、训练和迭代,推动LLM在游戏场景中的技术突破; 4、与游戏制作管线中的其他团队紧密合作,打造新的AI游戏开发流程,创造次世代游戏体验;与工程团队紧密合作,交付稳定可靠的LLM服务。‌

logo of mihoyo
校招程序&技术类

1、探索大模型及Agent技术在游戏领域的前沿应用,包括不限于智能NPC、AI交互叙事、AIGC游戏内容生成管线研发; 2、优化和提升游戏场景下的模型效果:SFT/RLHF训练策略、Reward Model、记忆系统、Agent架构; 3、预研大模型驱动的AI Native游戏玩法、提升游戏体验、确保内容可控性和实时推理性能等。

logo of mihoyo
校招程序&技术类

1、专研训练框架,快速定位训练中出现的问题,分析训练过程中的模型表现,跟infra team合作来保证训练策略的正确性 2、紧跟领域前沿技术,研究新型LLM模型架构,提升训练或推理的计算效率和模型性能 3、研究不同架构、数据、目标函数和优化方法等各个算法方面的scaling law,总结出高效稳定的预训练策略 4、拓展模型在长文本理解和生成的能力

logo of mihoyo
校招程序&技术类

LLM 中文eval 跟reward modeling