米哈游【日常实习】英文数据标注实习生
任职要求
任职要求 1. 具备卓越的英文语言能力,满足以下任一条件: 2. 英语专业八级(TEM-8)及以上水平; 3. 雅思(IELTS)成绩 7.5 分及以上…
工作职责
岗位职责 1. 深入理解并严格执行既定的评测标准和流程,对英文类大模型的输出内容进行多维度的标注和评测,包括但不限于语言逻辑连贯性、编写角色指令等。 2.针对不同类型的任务(如文本生成、问答等),准确判断模型输出是否满足任务要求,详细记录评测过程中发现的问题,如错误类型、出现频率、影响程度等,并形成清晰、准确的评测报告。 3.与研发团队、产品团队紧密协作,及时反馈评测中发现的模型缺陷和优化建议,为模型的训练和改进提供有价值的参考。 4. 关注行业内大模型评测的最新方法和技术动态,参与评测标准和流程的优化工作,不断提升评测工作的效率和质量。 5. 维护评测数据的准确性和完整性,确保数据的规范存储和安全使用。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动国际化短视频的数据科学团队负责运用专业的统计学知识和技能、出色的商业思维为数亿用户提供更优质的使用体验,期待有志同道合的新伙伴加入! 1、智能标注支持与优化:使用AIGC/LLM/多模态模型为商业化数据标注项目提供高质量的智能标注解决方案,包括利用Promt Engineering、RAG搭建LLM agent、多模态模型训练支持数据的自动标注与辅助标注;设计和实施数据增强策略,分析模型输出数据,识别潜在问题并提出改进建议; 2、模型评估与调优:开发评估指标和测试框架,评估AIGC/LLM或深度模型在不同应用场景中的表现;基于数据分析结果,提出模型调优方案,并落地实施; 3、数据驱动决策:通过数据分析和挖掘,为产品团队提供数据驱动的决策支持;跟踪行业最新趋势,探索AIGC/LLM领域的新数据源和应用场景; 4、跨团队协作:与算法工程师、产品经理、业务团队紧密合作,确保数据支持与业务需求对齐;参与项目需求讨论,提供数据科学角度的专业建议; 5、英语沟通:支持纯英文环境下,跨多团队,多国家地区的项目沟通与协调。
产品实习生 工作职责 1. 深度参与面向 AI 大模型的数据和标注平台的建设,与行业大牛紧密沟通,了解收集模型评测、标注的业务需求 2. 与经验丰富的产研团队团队一起进行产品设计与落地,包括需求拆解、PRD撰写、开发跟进、走查测试和发布 3. 维护产品文档,收集用户反馈,跟踪产品关键数据指标,不断优化产品体验
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与业内前沿的同传(同声传译)大模型项目,深入了解大型语言模型的策略迭代过程,协助完成数据标注和模型评测的落地实施; 2、参与同传大模型的策略迭代:协助收集和分析市场需求,参与制定同传大模型的产品策略和迭代计划;跟进产品开发、测试进度,与算法与工程技术团队合作,确保产品功能按时高质量交付;关注各场景的用户反馈,分析线上产品模型输出效果表现,分析后提出优化迭代方案; 3、模型数据标注支持:协助制定数据标注方案,确保数据符合模型训练要求;与内部标注团队沟通,跟进标注进度,保证数据质量;协助优化数据标注流程,提高效率和质量; 4、模型评测落地:参与设计模型评测标准和评测方法,确保评测过程客观、公正、全面;组织和实施模型评测,收集评测数据和结果;分析评测结果,与技术团队讨论,推动模型优化提升。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与业内前沿的同传(同声传译)大模型项目,深入了解大型语言模型的策略迭代过程,协助完成数据标注和模型评测的落地实施; 2、参与同传大模型的策略迭代:协助收集和分析市场需求,参与制定同传大模型的产品策略和迭代计划;跟进产品开发、测试进度,与算法与工程技术团队合作,确保产品功能按时高质量交付;关注各场景的用户反馈,分析线上产品模型输出效果表现,分析后提出优化迭代方案; 3、模型数据标注支持:协助制定数据标注方案,确保数据符合模型训练要求;与内部标注团队沟通,跟进标注进度,保证数据质量;协助优化数据标注流程,提高效率和质量; 4、模型评测落地:参与设计模型评测标准和评测方法,确保评测过程客观、公正、全面;组织和实施模型评测,收集评测数据和结果;分析评测结果,与技术团队讨论,推动模型优化提升。