百度数据标注分析 实习生(J53146)
实习兼职TPG地点:北京状态:招聘
任职要求
-现代汉语/英语语言学语法学、应用语言学、神经语言程序学及中英语言学相关专业的本科及以上学历,对中文、英文语法及语法理论有深入…登录查看完整任职要求
微信扫码,1秒登录
工作职责
-通过语言学知识来帮助制定语言学习的目标,形式化、结构化方案以及评估指标 -利用语言学方法和质量把控工具来帮助开发交互式语言学习与标注工具 -与设计师、技术人员一起建立语言学规则和知识库,提升人工智能相关产品整体体验 -与人工智能研究员一起,建立语言领域的人工智能模型
包括英文材料
学历+
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
相关职位
实习研发技术类
负责对语音唤醒和识别相关数据进行数据标注和分类; 能够快速理解学习标注数据的项目背景和规则,精准完成标注任务; 协助产品经理进行需求编写,行业洞察,产品路线规划等工作; 协助整理语音交互数据、统计分析、输出报告
更新于 2025-03-31深圳
实习ACG
-围绕大模型打造国际版的智能对话能力需要的数据,在指导下进行数据标注 -建设文档问答、业务式对话、表格问答等对话核心能力,在指导下进行多语种的数据标注 -分析模型效果问题和数据之间的关系,针对性调整数据情况 -分析数据格式和下游使用情况,提出能融入系统的标注格式,提出标注系统的有效需求 -能主动挖掘现有开源数据,任务数据,构造新的训练数据,如 long CoT 等
更新于 2025-08-15北京|成都
实习网易云音乐
1.语料数据收集处理与标注:参与社交场景的文本对话语料收集、清洗和标注工作;协助 LLM、TTS 语音数据的处理、分类和质量评估;设计并执行语料标注规范,确保数据质量;协助寻找音源,能够使用AI工具合成音频数据。 2.模型评测与质量控制:参与大模型输出结果的人工评测和质量分析;执行语料质量检查流程,确保标注准确性;协助建立评测标准,参与模型输出质量评估。 3.数据分析与报告:记录并分析标注过程中的问题和改进点;撰写数据处理和评测报告。
更新于 2025-07-11杭州