logo of tcl

TCL语音数据标注与分析实习生

实习兼职研发技术类地点:深圳状态:招聘

任职要求


1.本科及以上学历,数学、统计学专业优先;
2.具有良好的沟通能力,能与协作方高效沟通;
3.有责任心、做事…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责对语音唤醒和识别相关数据进行数据标注和分类;
能够快速理解学习标注数据的项目背景和规则,精准完成标注任务;
协助产品经理进行需求编写,行业洞察,产品路线规划等工作;
协助整理语音交互数据、统计分析、输出报告
包括英文材料
学历+
Python+
相关职位

logo of netease
实习网易云音乐

1.语料数据收集处理与标注:参与社交场景的文本对话语料收集、清洗和标注工作;协助 LLM、TTS 语音数据的处理、分类和质量评估;设计并执行语料标注规范,确保数据质量;协助寻找音源,能够使用AI工具合成音频数据。 2.模型评测与质量控制:参与大模型输出结果的人工评测和质量分析;执行语料质量检查流程,确保标注准确性;协助建立评测标准,参与模型输出质量评估。 3.数据分析与报告:记录并分析标注过程中的问题和改进点;撰写数据处理和评测报告。

更新于 2025-07-11杭州
logo of tcl
实习研发技术类

1、多模态数据处理与标注 根据机器人项目需求,对多种类型的数据(文本、图像、音频等)进行高质量标注与分类,确保数据的准确性与一致性;参与多模态数据(语音、图像、动作轨迹等)清洗、筛选与结构化处理,优化数据质量,为模型训练提供可靠的输入。 2、数据质量评估与优化 设计并执行数据质量评估流程,发现并解决数据中的问题;提出数据标注流程的优化建议,提升标注效率与质量。 3、模型反馈与迭代支持 与算法工程师协作,分析模型训练结果,识别数据中的潜在问题并提出改进方案;根据模型需求,参与数据集的扩充与多样化处理,支持模型性能的持续优化。 4、跨部门协作 与产品、算法及工程团队紧密合作,理解业务需求,确保数据标注与处理符合项目目标;参与团队内部的知识分享与培训,对AI及具身智能技术有更进一步的了解。

更新于 2025-10-31上海
logo of tcl
社招研发技术类

1、多模态数据处理与标注 根据机器人项目需求,对多种类型的数据(文本、图像、音频等)进行高质量标注与分类,确保数据的准确性与一致性;参与多模态数据(语音、图像、动作轨迹等)清洗、筛选与结构化处理,优化数据质量,为模型训练提供可靠的输入。 2、数据质量评估与优化 设计并执行数据质量评估流程,发现并解决数据中的问题;提出数据标注流程的优化建议,提升标注效率与质量。 3、模型反馈与迭代支持 与算法工程师协作,分析模型训练结果,识别数据中的潜在问题并提出改进方案;根据模型需求,参与数据集的扩充与多样化处理,支持模型性能的持续优化。 4、跨部门协作 与产品、算法及工程团队紧密合作,理解业务需求,确保数据标注与处理符合项目目标;参与团队内部的知识分享与培训,对AI及具身智能技术有更进一步的了解。

更新于 2025-10-31上海
logo of bytedance
实习A22676

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与业内前沿的同传(同声传译)大模型项目,深入了解大型语言模型的策略迭代过程,协助完成数据标注和模型评测的落地实施; 2、参与同传大模型的策略迭代:协助收集和分析市场需求,参与制定同传大模型的产品策略和迭代计划;跟进产品开发、测试进度,与算法与工程技术团队合作,确保产品功能按时高质量交付;关注各场景的用户反馈,分析线上产品模型输出效果表现,分析后提出优化迭代方案; 3、模型数据标注支持:协助制定数据标注方案,确保数据符合模型训练要求;与内部标注团队沟通,跟进标注进度,保证数据质量;协助优化数据标注流程,提高效率和质量; 4、模型评测落地:参与设计模型评测标准和评测方法,确保评测过程客观、公正、全面;组织和实施模型评测,收集评测数据和结果;分析评测结果,与技术团队讨论,推动模型优化提升。

更新于 2025-03-20上海