
完美世界人工智能人文训练师实习生
人工智能技术的迅猛发展正在重塑用户需求与交互方式,为外卖行业带来前所未有的挑战与机遇。我们采用内部创业小团队模式,专注于探索全新的AI应用场景,打造未来外卖行业的创新引擎。
1. 对大语言模型评估结果做深入数据分析,理解不同评估指标与用户体验、需求之间的关联,对模型训练迭代提供指导意见 2. 研发可靠的大语言模型评估管线,制定针对角色扮演、创意写作等能力的自动或人工评测准则与方法,构建对应的评测数据集 3. 开发大语言模型评测框架与平台,支持大规模快速的分布式评测,可视化支持各种类型的评测,快速适应不断变化的需求
1. 对大语言模型评估结果做深入数据分析,理解不同评估指标与用户体验、需求之间的关联,对模型训练迭代提供指导意见 2. 研发可靠的大语言模型评估管线,制定针对角色扮演、创意写作等能力的自动或人工评测准则与方法,构建对应的评测数据集 3. 开发大语言模型评测框架与平台,支持大规模快速的分布式评测,可视化支持各种类型的评测,快速适应不断变化的需求
职位描述: 我们正在寻找专注于提升大模型在科学推理领域能力的研究员,重点优化模型在人文社会科学、心理学、哲学、数学、物理、生物/医学、化学、计算机科学/人工智能、工程等领域的理解与推理能力,推动大模型在复杂科学问题上的表现,使其能够解决类似人类高水平考试中的问题。 岗位职责: 1. 优化模型推理能力:研究并优化大模型在数学、物理、生物/医学、计算机科学、工程、人文社科、心理学、哲学、农学等领域的推理能力。 2. 开发科学基准测试:构建科学推理任务与评测方法,衡量模型在复杂学术问题上的表现。 3. 训练数据集构建:收集和整理高质量的科学数据,以支持模型强化学习训练。 4. 多模态推理:结合文本、公式、图像、实验数据等多种数据类型,探索提升大模型科学推理能力的方案。