logo of transsion

传音大模型语言数据标注实习生(J18213)

实习兼职地点:重庆状态:招聘

任职要求


1.英专、汉语言、语言学、小语种、计算语言学、语言学及应用语言学、语言与言语信息处理专业等,了解过计算语言学或语料库语言学等方向课程,本科及以上学历,理论语言学基础扎实过硬,对应用语言学知识到工业界有强烈的兴趣。
2.英语水平良好,有雅思、托福成绩证书优先。
3.能够一周连续出勤至少四天优先。
4.会基础编程,能使用python进行文本处理、正则表达式优先。
5.…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.学习并参与对话系统、大模型前沿方向的数据运营工作,如意图分类、实体识别、文档摘要、角色扮演、AI搜索、文生图等,重点负责模型的数据集制作和标签管理。了解业务流程和算法流程,完成复杂标注任务的设计,在此基础上对原始数据进行处理,包括数据的爬取、筛选和清洗,并制定标注标准。
2.培训海外标注团队,进行数据质检,把控标注质量,确保数据的准确性和一致性。
3.按项目要求对模型进行评测和效果分析,完成复杂的数据分析任务,及时反馈问题,根据模型效果调整数据和标注策略。
包括英文材料
学历+
Python+
NLP+
还有更多 •••
相关职位

logo of netease
实习网易云音乐

1.语料数据收集处理与标注:参与社交场景的文本对话语料收集、清洗和标注工作;协助 LLM、TTS 语音数据的处理、分类和质量评估;设计并执行语料标注规范,确保数据质量;协助寻找音源,能够使用AI工具合成音频数据。 2.模型评测与质量控制:参与大模型输出结果的人工评测和质量分析;执行语料质量检查流程,确保标注准确性;协助建立评测标准,参与模型输出质量评估。 3.数据分析与报告:记录并分析标注过程中的问题和改进点;撰写数据处理和评测报告。

更新于 2025-07-11杭州
logo of sohu
实习产品

1、根据标注规则,对各类AI的文本进行标注工作; 2、对大模型数据标注的结果进行审核,确保数据质量; 3、与其他相关部门保持良好的沟通,为项目提供支持。

北京
logo of baidu
社招3-5年MEG

-高级自然语言策略工程师,负责设计和优化基于大语言模型的产品策略落地,将前沿研究应用到真实业务场景中,为数百万用户提供卓越的文小言APP智能体验。 -策略设计与研发:基于大语言模型的核心产品策略设计与研发,制定技术路线图,推动创新解决方案落地 -模型训练与调优:基于RLHF等强化学习方法的大语言模型训练和精细化调优方案,提升模型在多场景下的表现 -自动化工具开发:构建和完善语料自动生成和智能标注系统,提升数据生产效率和质量 -用户行为分析:执行用户行为数据分析工作,构建用户意图识别和理解模型,优化产品决策机制和交互体验 -策略评估框架:建立科学的策略评估体系,包括离线评测和在线A/B测试方案,指导产品持续迭代优化 -跨团队协作:与产品、研发、设计等团队紧密协作,将先进NLP技术转化为产品竞争力,推动业务增长 -团队指导:指导初级工程师和实习生,提供技术指导和职业发展建议,提升团队整体技术水平

更新于 2025-03-18北京
logo of xiaohongshu
实习模型标注

岗位职责: 1、梳理和解读大模型相关的评测业务,辅助进行定制化的评测框架体系构建,完善内部评测机制; 2、针对交付评测数据进行数据验收,反馈指标以及数据问题,引导评测同学进行质量提升; 3、针对市场上大模型相关应用进行摸底调研,结合内部模型方向给到模型优化改进意见;

更新于 2025-02-27北京