小红书AI人文训练实习生-大模型
任职要求
1、文理兼修:曾受过心理学/哲学/文学/历史/艺术等方向的专业训练,同时有较好的逻辑思维与批判性思维习惯,能在捕捉细腻情感与抽象思考间游刃有余; 2、有较好的文字功底:对文字表达有足够的敏感,擅长通过文字表达自己的思想并感染他人; 3、…
工作职责
1、建立与执行 AI 行为评估体系:基于真实用户需求、典型使用场景与风险点,设计系统化的评估标准与测试集,并将评估结果转化为可执行的优化方向,让 AI 的回答更贴合人类的真实问题、真实语境、真实情绪。 2、设计并训练 AI 的表达方式:基于广博的人文视角和跨文化理解,萃取历史、哲学及心理学中的精华思想,塑造 AI 的底层世界观、价值观、性格和行为准则,确保 AI 的对话既专业可信,又易被用户理解与信任。
1. 负责强拟人对话模型的高质量语料库构建,设计并落地科学的模型评估框架,保障数据质量与评估有效性 2. 深度分析对话交互数据,精准提炼模型优化方向,推动技术团队实现模型迭代
你的核心职责是通过构建和评估高质量数据,来塑造和优化AI角色的表现。具体工作包括: 1.创作高质量的训练数据:围绕角色设定(性格、背景、世界观等),撰写大量符合其风格的对话范例,作为模型训练的核心素材。 2.进行精细化的数据标注与评估:对AI生成的对话内容进行多维度评估,判断其是否符合角色设定、逻辑连贯、情感表达准确等。你的标注结果将直接用于模型的迭代优化。 3.参与AI效果评测:执行系统性的评测方案,全面检验AI角色的交互能力和表现,识别问题并提出具体的优化建议。
我们正在寻找专注于提升大模型在科学推理领域能力的研究员,重点优化模型在人文社会科学、文学、心理学、哲学、数学、物理、生物/医学、化学、计算机科学/人工智能、工程等领域的理解与推理能力,推动大模型在复杂科学问题上的表现,使其能够解决类似人类高水平考试中的问题。 岗位职责: 优化模型推理能力:研究并优化大模型在数学、物理、生物/医学、计算机科学、工程、人文社科、心理学、哲学、农学等领域的推理能力。 开发科学基准测试:构建科学推理任务与评测方法,衡量模型在复杂学术问题上的表现。 训练数据集构建:收集和整理高质量的科学数据,以支持模型强化学习训练。 多模态推理:结合文本、公式、图像、实验数据等多种数据类型,探索提升大模型科学推理能力的方案。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:AI数据与安全团队为Seed基座模型及AI原生应用提供跨模态数据服务,覆盖数据生产全流程,包含模型评估标准的制定、数据规模化生产、数据飞轮搭建,不断提升数据质量,支持模型快速迭代。 团队由产品经理、数据工程、数据运营等跨职能人才组成,并通过与Seed研究员、行业专家、全球顶尖数据供应商紧密合作,从真实场景中收集反馈并分析模型表现数据,解决AI前沿突破过程中的复杂数据问题,推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者,也是模型和AI产品的一手用户。 1、这个职位是连接前沿AI技术与深度专业知识的桥梁,你将不再仅仅是知识的创造者,而是整个知识增强项目的核心枢纽,负责管理从需求理解到数据交付的全链路流程,确保大模型在人文社科领域的认知与推理能力得到高效、高质量的提升; 2、与算法、产品团队紧密协作,深入理解大模型在特定领域的能力短板与迭代目标,将模糊的"模型能力提升需求"精准转化为清晰、可执行的数据生产任务与项目目标; 3、负责高质量数据生产项目的全生命周期管理,包括制定项目计划、定义数据标准、监控生产进度与风险,设计并优化数据生产的工作流,探索并落地可规模化、高效率的数据生产模式,确保项目按时、按质、按量交付; 4、建立并执行严格的数据验收标准与质检流程,对产出的结构化资料、评测数据集进行专业评估与验收,对数据质量问题进行归因分析,形成反馈闭环,持续指导和优化数据生产策略,推动数据质量的迭代提升; 5、负责领域专家资源的招募、培训与日常管理,构建并维护高质量的外部专家智库,为专家提供清晰的任务指引和必要的赋能培训,确保他们能够高效、准确地产出符合要求的数据,并对专家工作质量进行评估与管理。