米哈游LLM算法工程师(评测方向)
任职要求
1. 计算机科学、人工智能或相关领域的硕士及以上学历 2. 对大语言模型的工作原理有较深入的理解,掌握基础的模型部署方法 3. 对大语言模型评测体系有较深入的理解,并能构建评估方法以改进模型性能 4. 熟练掌握python,能够深入大型机器学习代码库进行调试 5. 有良好的中英文阅读和鉴赏 加分项 1. 在ACM/…
工作职责
1. 对大语言模型评估结果做深入数据分析,理解不同评估指标与用户体验、需求之间的关联,对模型训练迭代提供指导意见 2. 研发可靠的大语言模型评估管线,制定针对角色扮演、创意写作等能力的自动或人工评测准则与方法,构建对应的评测数据集 3. 开发大语言模型评测框架与平台,支持大规模快速的分布式评测,可视化支持各种类型的评测,快速适应不断变化的需求
1. 对大语言模型评估结果做深入数据分析,理解不同评估指标与用户体验、需求之间的关联,对模型训练迭代提供指导意见 2. 研发可靠的大语言模型评估管线,制定针对角色扮演、创意写作等能力的自动或人工评测准则与方法,构建对应的评测数据集 3. 开发大语言模型评测框架与平台,支持大规模快速的分布式评测,可视化支持各种类型的评测,快速适应不断变化的需求
我们是AliExpress广告算法团队,该岗位负责AE搜索广告的NLP&相关性、用户体验优化,包括并不限于: 1. 设计和优化搜索广告相关性下的Query理解、类目预测、深度语义相关性、商品理解、实体匹配等方向 2. 对比学习、表征学习、蒸馏学习在语义理解、类目预测、相关性判别等领域的应用和创新 3. 设计合理的全链路管控与供给策略,保证消费者体验、广告主投放效果、平台营收的良好平衡 4. LLM、MLLM在上述方向的全面应用与优化 5. 建立合理的相关性评测方法,进行数据挖掘,迭代数据标注任务,积累电商领域知识数据资产
1. 参与并负责严选事业部AI Agent的技术方案设计、LLM选型、Agent构建、Prompt设计、效果评测等工作; 2. 推进事业部AI工具链的建设,负责引入优秀的技术框架和解决方案,包括但不限于向量数据库、Agent构建工具、MCP Server等。
业务场景: 在开放世界游戏环境中,进行游戏内容理解与动态解说,驱动智能体完成指定任务、实现自主探索,并支持多智能体复杂交互等前沿AI应用场景。 岗位职责: 研究与开发: 负责开放世界游戏场景下基于大语言模型(LLM)及视觉语言模型(VLM)的智能体(Agent)技术研究与开发,涵盖Prompt工程、上下文学习(ICL)、检索增强生成(RAG)、监督微调(SFT)、强化微调(RFT)等关键技术。 框架与工具链构建: 主导游戏智能体核心框架的设计与实现,推动训练数据合成、自动化评测体系及相关算法的研发。 工业化落地: 推动游戏智能体技术在游戏内容生产与玩家消费场景的工业化部署与产品化落地,实现技术价值转化。