logo of mi

小米大模型数据策略实习生

实习兼职地点:武汉状态:招聘

任职要求


1. 计算机、统计学、人工智能、数学、语言学等相关专业本科及以上在校生,2026届优先。
2. 具备基础机器学习知识(如分类、回归、评估指标),了解模型训练流程优先; 对数据敏感,逻辑清晰,具备问题分析与解决能力优先…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 大模型效果评估与Badcase分析
对大模型输出结果进行分析标注,明确Badcase,定位问题原因(如数据缺失、数据混淆、意图识别错误、模型幻觉等),并形成优化建议报告。
2. 根据标注规范完成文本、图像、多模态数据的标注任务(如目标检测、语义分割、分类等),确保标注数据符合模型训练要求。
参与标注流程优化,协助制定质量控制标准,通过抽查、复核等方式提升标注准确性。
3. 数据处理与工具支持
使用Python、SQL等工具清洗、处理原始数据,支持模型训练与评估需求。
包括英文材料
机器学习+
数据分析+
还有更多 •••
相关职位

logo of mi
实习

1. 大模型效果评估与Badcase分析 对大模型输出结果进行分析标注,明确Badcase,定位问题原因(如数据缺失、数据混淆、意图识别错误、模型幻觉等),并形成优化建议报告。 2. 根据标注规范完成文本、图像、多模态数据的标注任务(如目标检测、语义分割、分类等),确保标注数据符合模型训练要求。 参与标注流程优化,协助制定质量控制标准,通过抽查、复核等方式提升标注准确性。 3. 数据处理与工具支持 使用Python、SQL等工具清洗、处理原始数据,支持模型训练与评估需求。

更新于 2025-07-01北京
logo of bytedance
实习A173958A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、利用大模型经验和PE提示词工程,对数据标注流程和体系进行全面评估和优化,定位效率瓶颈并提出优化方案,提升标注效率; 2、协助产品研发团队优化算法和标注策略,更好地适配标注任务的需求; 3、与数据标注团队紧密合作,培训和指导团队成员,提高标注的技能水平和工作效率; 4、跟踪行业最新技术动态,引入先进的方法和工具,持续提升标注效率和质量,为团队大模型应用提供前瞻性的建议和策略。

更新于 2025-02-14北京
logo of mi
实习

参与大模型数据清洗及处理技术的研发与优化,包括但不限于: 1.大模型数据质量的持续提升改进与实现; 2.参与数据主题分类模型的构建 3.VLM数据的合成与生产的协同优化; 4.提示工程(Prompt Engineering)的探索 5.构建和评测数据的质量及评估的方法及评测集的构建 6.跟进学术界与工业界最新进展。

更新于 2025-09-09北京
logo of bytedance
实习A139214

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、参与大语言模型的数据策略制定,确保数据标注的流程与质量符合预期目标; 2、定义和优化提示词,提升模型的响应质量和准确度; 3、分析和评估不同数据策略对模型训练效果的影响,并提出优化建议; 4、与团队紧密合作,持续改进数据处理策略和方法,确保数据处理的一致性和高效性。

更新于 2024-12-25北京