米哈游大语言模型数据专家实习生
任职要求
1. 本科及以上学历,有较强的文本内容理解和情绪感知能力,对文学、心理学、哲学、历史、影视、游戏等任意领域有浓厚兴趣;
2. 具备良好的逻辑分析与表达能力,善于发现问题并提出系统科学的解决方案,推动项目顺利进行;
3. 自驱力强,能主动了解并快速跟进项目变化,适应快节奏、多…工作职责
你将成为我们下一代AI大模型的“首任教师”。你做出的每一个判断、参与的每一段对话,都将塑造它的知识边界、沟通风格甚至“人格” 1. 建设高质量、多样化的文本数据集,不断优化标注策略、完善数据规范,与算法团队共同打造全新的自研大模型,为用户带来沉浸式的真人对话体验; 2. 持续关注模型成长,定期参与模型能力评测,从数据中定位模型优化点并制定针对性的数据建设方案; 3. 与团队内部、外部伙伴紧密协作,精准理解数据需求,高效推动标注流程,及时把控项目风险,对交付结果负责。
-参与AI大语言模型研发,负责大模型所需语料、知识的建设,通过构建优质、丰富的数据,驱动大模型能力不断提升 -建设基于知识的推理和规划能力,驱动AI大模型具备更加智能的代码生成、代码理解等能力 -基于大语言模型推进算法技术的能力提升,推进技术在业务上取得价值 -设计并实现数据构建系统方案,通过算法/工具/平台等手段,不断优化数据建设的效率 -协同产品经理、数据专家,共同推进项目高效开展和高质量交付
研究领域: 人工智能 项目简介: 一句话描述:研究大模型训练中不同样本对模型训练质量的影响,利用大模型智能标注能力结合并将动态权重反馈信息提升样本质量及训练效果 随着大语言模型的发展,其多种能力不断涌现。而在大模型的实际研发中,越来越多研究人员发现训练数据的质量至关重要,进而开始转向研究以数据为中心的AI研究,其主要目的就是想办法加强数据的质量和数量,而不过多的考虑模型或者说固定模型结构。由此催生出了一系列的数据标注公司,而蚂蚁内部也有专门的标注团队给大模型训练提供标注数据,尤其是领域数据以及人类对齐数据。那么什么样的标注数据对大模型能力有帮助,能提升大模型在各个任务上的效果?目前在学术界和产业界在以数据为中心的模型研究仍处于初期阶段,各种方法都在探索中。 在当前数据标注场景下,目前我们需要攻坚的技术有:1. 训练样本质量评价问题。即如何提升具体模型对于数据自身的感知,快速识别低质样本或增强高质量样本,从而加强模型迭代的性能。目前我们的方案是将生成模型生成概率分布中的“犹豫”特征映射为模型对样本高价值的体现,同时结合评估损失来拟合前序的样本训练过程,最后引入BERTSCORE去对抗可能的模型幻觉;2.训练样本质量增强问题。如何将样本价值注入专家标注流程,从主动学习角度增强样本质量。目前我们的方案是在少量融合专家经验的标注样本上,基于大模型完成快速增量训练,进而将这种标注能力泛化到更多数据场景上;3. 样本价值训练中消费问题。如何在训练过程中,设计合适的训练框架使得模型感知样本价值的变化,使得样本质量指标增益模型训练的效果。目前我们的方案是在训练过程中引入无监督的样本权重传播机制,通过捕捉训练过程中样本的语义表征变化来检验模型的学习过程,同时通过引入样本平滑策略,使得训练过程中模型可以不断感知后续样本的重要性并对其做出反馈; 基于以上的技术攻坚,我们可以获得:1.建立带感知的标注数据质量评估的体系;2. 智能标注的能力;3.大模型训练框架对标注样本的动态反馈体系; 4. 标注数据质量评估的体系;5.大模型训练框架对标注样本的动态评估
小鹏机器人中心致力于研发先进的人形机器人技术,包括机器人的行走,操作,智能导航,在大语言模型支撑下的人机交互等。我们拥有世界一流的软硬件团队,分布于深圳,上海,北京,广州和北美。作为计算机视觉和多模态大模型领域实习生,你将和机器人中心相关领域的工程师共同解决科研和工程问题。我们将共同成长,在人形机器人前沿领域留下自己印记。 你将获得: • 最前沿的AI相关技术,包括端到端导航,视觉和多模态基础大模型训练,推理,数据获取,机器人平台的应用部署等。 • 行业专家的指导。对于优秀的工作,我们会鼓励和帮助文章发表或专利申请。 • 完备的实验室条件, 包括充分的计算资源,机器人硬件平台等。 • 实习生是公司的宝贵财富,对于即将毕业的优秀的实习生,我们会优先考虑其全职工作申请。
小鹏机器人中心致力于研发先进的人形机器人技术,包括机器人的行走,操作,智能导航,在大语言模型支撑下的人机交互等。我们拥有世界一流的软硬件团队,分布于深圳,上海,北京,广州和北美。作为计算机视觉和多模态大模型领域实习生,你将和机器人中心相关领域的工程师共同解决科研和工程问题。我们将共同成长,在人形机器人前沿领域留下自己印记。 你将获得: • 最前沿的AI相关技术,包括端到端导航,视觉和多模态基础大模型训练,推理,数据获取,机器人平台的应用部署等。 • 行业专家的指导。对于优秀的工作,我们会鼓励和帮助文章发表或专利申请。 • 完备的实验室条件, 包括充分的计算资源,机器人硬件平台等。 • 实习生是公司的宝贵财富,对于即将毕业的优秀的实习生,我们会优先考虑其全职工作申请。