logo of xiaohongshu

小红书模型标注-模型数据策略运营

社招全职1-3年模型标注地点:武汉 | 北京状态:招聘

任职要求


1、本科以上学历,具备1年以上互联网内容产品相关的AI模型训练经历,熟知模型训练的常用方法、训练过程中的模型效果调优和问题解决办法,成功交付过业务模型;
2、熟知标注业务全链路,至少具备1个垂类(搜索/商业化/交易/安全/内容理解等)的业务执行及策略经验,具备整体数据解决方案的能力;
3、具备大模型应用的实战经验,有过以大模型应用…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、对业务模型训练效果的数据负责,与算法进行专业对话,结合模型能力要求进行数据策略的制定,为模型效果提供最优解决方案,支持从模型冷启、样本设计、数据生产、效果优化、线上监控的全过程,推动策略迭代提升模型效果;
2、负责搜索、安全生态、内容理解、大模型、商业交易等业务板块的模型需求,基于业务场景模型的应用效果设计运营链路,从模型实际应用收益出发,推动模型的策略、规则、数据链路的优化;
3、基于行业常见智能化应用手段,例如agent、rag、pe等,进行智能化标注策略设计,提供专业的智能化数据方案,搭建人机协同、智能化标注等数据链路,拿到效率、成本的收益;
4、保持数据行业前沿的视角和前瞻性的专业思考,持续推进智能化标注策略迭代,同时辅助内部工具平台、组织与业务交付流程的优化,提出有效建议,提高团队整体业务效率。
包括英文材料
学历+
大模型+
还有更多 •••
相关职位

logo of xiaohongshu
社招1-3年模型标注

1. 预训练语料策略与体系搭建,负责大模型预训练阶段的数据策略,覆盖通用语料、垂直领域语料的全流程数据方案设计。 2. 主导数据评估:建立清晰可量化的数据评估标准,提高评估效率;验证数据有效性,推动模型迭代; 3. 数据驱动的模型迭代,深度理解预训练技术原理,通过数据分析定位模型能力短板,制定针对性数据补充策略,推动模型技术迭代升级。 4. 前沿探索,保持对开源模型(如DeepSeek、Qwen等)及学术前沿的敏锐度,沉淀可复用的数据方法论,为团队提供中短期数据策略规划。 5. 与算法、技术团队合作开发数据工具链,主动发现问题,发起项目,管理数据生产团队,把控数据质量与项目进度,推动跨团队高效协作,确保数据按时高质交付。 6. 主导垂直领域语料体系的从0到1搭建(包括但不限于人文/学科/code等体系),能够定义各体系的质量标准,并设计可量化的评估指标。

更新于 2025-12-23北京|上海
logo of bytedance
社招A222959B

1、负责内容安全模型训练及评估数据的项目交付全流程管理,从需求分析、方案设计到落地执行与持续优化,确保项目高效、高质量完成; 2、深入理解算法、产品等团队的业务目标与数据需求,主导数据生产策略的制定与迭代,将复杂的业务问题转化为可落地、可规模化的数据解决方案; 3、构建并持续优化数据生产的标准化流程、操作规范与质量体系,识别流程中的效率瓶颈与质量风险,通过机制设计、工具提效、自动化等手段提升交付效率与稳定性; 4、作为项目核心推动者,协同算法、产品、标注、运营等多方团队,统筹项目进度,识别并解决项目推进中的卡点与风险,保障项目目标达成; 5、建立项目交付的质量评估与复盘机制,通过数据监控、问题分析、案例沉淀等方式,推动交付质量与团队效能的持续提升,形成可复用的最佳实践。

更新于 2026-02-26上海
logo of netease
社招3-5年网易云音乐

1、利用内容理解技术帮助社区推荐完成实时推荐、互动生态、内容创作、兴趣探索、用户多样性等场景需求; 2、通过基座模型的优化及迭代,内容标签体系的建设,承接并健全社区生态里各维度的内容体系,完成透视及业务刻画的目标; 3、制定增长or生态策略持续优化用户的浏览体验,完成对于社区业务的发展及创新。

更新于 2025-07-10北京
logo of netease
社招3-5年网易云音乐

1.全流程搭建与管理​ • 主导文本对话、TTS音频数据的标注流程设计,制定多模态标注规范与质控体系(含预标注策略、自动化质检)。 2.团队与外包管理​ • 组建、管理标注团队(含全职/外包),负责招募、培训、绩效考核及成本优化。 3.数据质量与模型迭代闭环​ • 建立数据质量监控指标,分析模型缺陷,推动标注策略迭代反哺模型优化。 4.跨团队协作​ • 联动算法、产品、语音技术团队,对齐标注需求与训练目标,确保数据驱动虚拟人交互体验提升。 5.效率工具开发​ • 推动智能标注工具开发(如基于大模型的自动预标注、批量质检),提升标注效率30%+。

更新于 2025-08-20杭州