logo of mihoyo

米哈游LLM算法工程师(评测方向)

社招全职程序&技术类地点:上海状态:招聘

任职要求


1.	计算机科学、人工智能或相关领域的硕士及以上学历 
2.	对大语言模型的工作原理有较深入的理解,掌握基础的模型部署方法 
3.	对大语言模型评测体系有较深入的理解,并能构建评估方法以改进模型性能 
4.	熟练掌握python,能够深入大型机器学习代码库进行调试 
5.	有良好的中英文阅读和鉴赏

加分项
1.	在ACM…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.	对大语言模型评估结果做深入数据分析,理解不同评估指标与用户体验、需求之间的关联,对模型训练迭代提供指导意见 
2.	研发可靠的大语言模型评估管线,制定针对角色扮演、创意写作等能力的自动或人工评测准则与方法,构建对应的评测数据集 
3.	开发大语言模型评测框架与平台,支持大规模快速的分布式评测,可视化支持各种类型的评测,快速适应不断变化的需求
包括英文材料
学历+
Python+
机器学习+
还有更多 •••
相关职位

logo of alibaba
社招技术类-算法

我们是AliExpress广告算法团队,该岗位负责AE搜索广告的NLP&相关性、用户体验优化,包括并不限于: 1. 设计和优化搜索广告相关性下的Query理解、类目预测、深度语义相关性、商品理解、实体匹配等方向 2. 对比学习、表征学习、蒸馏学习在语义理解、类目预测、相关性判别等领域的应用和创新 3. 设计合理的全链路管控与供给策略,保证消费者体验、广告主投放效果、平台营收的良好平衡 4. LLM、MLLM在上述方向的全面应用与优化 5. 建立合理的相关性评测方法,进行数据挖掘,迭代数据标注任务,积累电商领域知识数据资产

更新于 2025-03-31杭州
logo of netease
社招2年以上网易严选

1. 参与并负责严选事业部AI Agent的技术方案设计、LLM选型、Agent构建、Prompt设计、效果评测等工作; 2. 推进事业部AI工具链的建设,负责引入优秀的技术框架和解决方案,包括但不限于向量数据库、Agent构建工具、MCP Server等。

更新于 2025-06-20杭州
logo of netease
社招3年以下网易游戏(雷火)

业务场景: 在开放世界游戏环境中,进行游戏内容理解与动态解说,驱动智能体完成指定任务、实现自主探索,并支持多智能体复杂交互等前沿AI应用场景。 岗位职责: 研究与开发: 负责开放世界游戏场景下基于大语言模型(LLM)及视觉语言模型(VLM)的智能体(Agent)技术研究与开发,涵盖Prompt工程、上下文学习(ICL)、检索增强生成(RAG)、监督微调(SFT)、强化微调(RFT)等关键技术。 框架与工具链构建: 主导游戏智能体核心框架的设计与实现,推动训练数据合成、自动化评测体系及相关算法的研发。 工业化落地: 推动游戏智能体技术在游戏内容生产与玩家消费场景的工业化部署与产品化落地,实现技术价值转化。

更新于 2025-08-22杭州
logo of antgroup
社招技术类-算法

大模型数据认知方向,负责设计和开发先进的算法,解决大模型数据生产中的关键问题,包括但不限于数据知识体系生成、语料自动分类、智能数据标注、权威评测集建设以及基于评测的语料质量评估与合成。你的工作将直接影响蚂蚁大模型的训练效果和性能表现。工作将涉及以下1个或多个方向 ● 数据知识体系生成: 研究基于LLM的自动知识图谱生成技术,设计并实现自动化算法,构建高效、可扩展的大模型数据知识体系。 ● 语料自动分类: 基于数据知识体系,研究和开发语料分类算法,指导大模型数据的拓展方向; ● 权威评测集建设: 研究业界现有评测集的缺陷,构建标准化、多样化的权威评测集,用于评估大模型的性能; 与跨职能团队合作,确保评测集覆盖全面且具有代表性。 ● 语料质量评估与合成: 建立大模型训练的数据驱动体系,开发语料质量评估算法,识别低质量或噪声数据。 研究数据驱动的语料合成技术,基于模型的评测效果,针对性合成能够改进模型效果的训练语料,提升模型迭代效率 ● 智能标注链路研发: 基于大模型数据的标注需求,研发辅助打标算法; 设计构建 AI辅助的标注质量检验与标注提效的算法链路,提升人工标注的质检效率与标注质量 ● 技术创新与优化: 持续跟踪学术界和工业界的最新研究成果,探索前沿技术在大模型数据中的应用。 针对实际业务需求,提出创新性的解决方案并快速落地。

更新于 2025-06-18杭州