logo of meituan

美团大模型数据运营-推理方向

社招全职核心本地商业-基础研发平台地点:北京 | 成都状态:招聘

任职要求


1. 计算机/数学/其他理工科相关专业 本科及以上学历
2. 精通SQL/Python等分析工具,具有良好的数据分析能力
3. 对大模型行业感兴趣,具备良好的沟通能力和团队协作精神
4. 强调细节并注重端到端效果,能够适应快节奏的工作环境

具备以下条件优先
1. 具备建模/编程竞赛获奖经历者优先
2. 有标注供应商管理经验者优先

工作职责


1. 制定符合大模型训练需求的数学/代码/stem数据标注与运营策略
2. 建立数据质量管理体系,设计标注标准与验收机制,并组织标注团队生产数据
3. 设计自动化数据合成方案(PE/模型微调等),实现大规模高质量数据生成
4. 监测模型在推理方向的效果,持续优化数据生产策略
包括英文材料
学历+
SQL+
Python+
数据分析+
大模型+
相关职位

logo of meituan
实习核心本地商业-基

1. 数据标注执行:人工对大模型训练所需的推理数据进行判断、排序或改写;通过prompt engineering合成大批量高质数据,确保数据的准确性和一致性; 2. 标注方案制定:分析模型效果、调研论文或收集行业数据,沉淀相关结果文档,支持数据方案迭代/优化; 3. 标注项目管理:协助负责人管理内/外部标注人力,完成包括但不限于培训、质检、答疑等工作; 4. 团队协作:与技术团队紧密合作,及时反馈问题,根据模型效果及时调整标注策略。 5. 模型实验(代码方向):参与数据自动合成实验,负责模型微调并落地各种训练实验

更新于 2025-04-10
logo of meituan
实习核心本地商业-基

1. 深入理解多模态大模型,调研多语种语音音系特征、完善标注规范、验收数据质量,为业务和算法提供知识技能支持; 2. 负责大模型语音数据的质量监控或验收等工作,并定期对语音技术效果做出评价与反馈; 3. 协助mentor管理一或多个语种的数据生产项目,协助产品和算法优化模型效果。

更新于 2025-05-19
logo of bytedance
实习A198180

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。

更新于 2025-09-05
logo of bytedance
实习A163611A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性; 2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差; 3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性; 4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。

更新于 2025-09-05