logo of meituan

美团大模型数据运营专家

社招全职3年以上核心本地商业-基础研发平台地点:北京状态:招聘

任职要求


1.本科及以上学历,计算机、数据科学、统计学、人工智能等相关专业优先。
2.3年以上数据运营或者AI数据相关工作经验,有大模型LLM)数据经验者优先。
3.对大模型和数据工作抱有热情,对数据市场敏锐。
4.优秀的沟通能力,能协调内外部团队,推动数据项目落地。

工作职责


1.数据策略与规划:负责文本和多模态大模型训练数据(包括预训练和后训练)的数据建设统筹规划,包括数据调研、数据引入、数据质量标准制定、数据验收等。
2.渠道管理:管理相关数据渠道,通过合作引入相关数据。
3.数据创新:探索新的数据来源(如开源数据、合成数据、用户反馈数据),提升数据规模和质量。
包括英文材料
学历+
数据科学+
大模型+
相关职位

logo of bytedance
社招A209514A

1、基于产品研发运营和业务需要,在内容垂类方向产出高质量文本数据,用于相关大模型训练; 2、参与大模型垂类数据标注标准的制定和优化,在既定标注标准下,完成相关数据的生产任务,总结抽象各类问题,反哺产品、研发、运营及业务,持续优化、细化标注标准,保障数据质量; 3、对数据生产方法进行探索,推动尝试,持续提升标注数据的准确性和生产效率。

更新于 2025-01-24
logo of bytedance
社招3年以上A156693

1、搭建具有通用性和可拓展性的NLP标注框架,与算法团队对齐标准、撰写相关培训方案,根据模型迭代方向提供高质量数据; 2、负责大语言模型训练过程中各阶段数据生产,对自动化链路搭建、数据质量评估及外部资源管理负责,确保大语言模型训练数据有效; 3、能通过PE、代码完成数据预处理、分析和清洗,按照训练需求进行标注、分析和验证调优,提升模型效果; 4、与产品算法团队协同,积极探索自动化数据生产、数据合成等方法,提高数据标注效率,持续跟踪大模型技术进展,持续探索智能高效的数据生产模式。

更新于 2025-05-20
logo of bytedance
社招3年以上A197094

1、搭建具有通用性和可拓展性的TTS标注框架,与算法团队对齐标准、撰写相关培训方案,根据模型迭代方向提供高质量数据; 2、负责大语言模型训练过程中各阶段数据生产,对自动化链路搭建、数据质量评估及外部资源管理负责,确保大语言模型训练数据有效; 3、能通过PE、代码完成数据预处理、分析和清洗,按照训练需求进行标注、分析和验证调优,提升模型效果; 4、与产品算法团队协同,积极探索自动化数据生产、数据合成等方法,提高数据标注效率,持续跟踪大模型技术进展,持续探索智能高效的数据生产模式。

更新于 2025-02-08
logo of xiaohongshu
社招1-3年模型标注

1. 负责大模型后训练阶段的数据策略,包括SFT、RLHF、DPO等对齐方法所需的数据,方向包含文本/多模态数据构建,设计全流程数据方案与策略,制定质量标准,搭建高效高质数据生产pipeline,有效提升技术预研和模型效果提升; 2. 深度理解大模型技术与产品,制定针对性数据策略,为模型效果突破提供专业建议,推动技术迭代升级; 3. 统筹协调上下游项目资源,对接算法团队需求,把控数据质量与项目进度,推动跨团队协作,确保目标高效达成。

更新于 2025-08-04