logo of xiaohongshu

小红书社区模型标注-大模型数据运营专家

社招全职1-3年模型标注地点:北京 | 上海 | 武汉状态:招聘

任职要求


1. 硕士及以上学历,语言学、计算语言学、语用学、心理学、汉语言等相关专业优先;
2. 2-3年文本/多模态大模型数据方向实战经验,熟悉数据合成、处理及语料库建设;
3. 有大语言模型任务设计和标注的科研或工作经历者优先,有语义学/语用学/心理学研究经历者/论文发表者优先;
4. 掌握基础编程技能(或AI编程),了解深度学习原理/模型原理或评测方案者优先;
5. 具备优秀的数据分析能力和问题解决能力,善于跨团队沟通;
6. 富有创新精神,逻辑思维强,能持续推动技术突破。

工作职责


1. 负责大模型后训练阶段的数据策略,包括SFT、RLHF、DPO等对齐方法所需的数据,方向包含文本/多模态数据构建,设计全流程数据方案与策略,制定质量标准,搭建高效高质数据生产pipeline,有效提升技术预研和模型效果提升;
2. 深度理解大模型技术与产品,制定针对性数据策略,为模型效果突破提供专业建议,推动技术迭代升级;
3. 统筹协调上下游项目资源,对接算法团队需求,把控数据质量与项目进度,推动跨团队协作,确保目标高效达成。
包括英文材料
学历+
大模型+
深度学习+
数据分析+
相关职位

logo of bytedance
社招A209514A

1、基于产品研发运营和业务需要,在内容垂类方向产出高质量文本数据,用于相关大模型训练; 2、参与大模型垂类数据标注标准的制定和优化,在既定标注标准下,完成相关数据的生产任务,总结抽象各类问题,反哺产品、研发、运营及业务,持续优化、细化标注标准,保障数据质量; 3、对数据生产方法进行探索,推动尝试,持续提升标注数据的准确性和生产效率。

更新于 2025-01-24
logo of 10jqka
校招研发技术类

1. 结合同花顺大模型等相关AIGC技术,参与全球内容平台系统开发,建设国内外资讯、视频等海量内容全品类全市场内容接入、智能审核、识别理解等能力,基于算法及分发策略实现Feeds、社区、问财等金融场景的信息精准分发,构建内容从生产、理解到分发的全生命周期链路,持续完善内容运营平台能力支撑国内及国际资讯业务发展; 2. 参与我们的NLP及其大模型应用落地项目,包括但不限于算法设计、数据标注和模型优化;基于大模型进行内容创作平台开发,利用大模型的语义理解能力、AI绘图能力和我们丰富的数据优势,针对金融场景进行自动化的文章创作及对热门事件深度解读,支撑国际化金融场景; 3. 理解并评估NLP特别是大模型方向的最新论文及技术成果,帮助团队保持对国际当前前沿研究动态的了解,与团队合作,将研究成果用于提升同花顺国内国际相关金融场景产品能力;

logo of 10jqka
校招研发技术类

1、探索AI技术在前端开发中的应用,共同研究如何通过Cursor、Cline、Lovable等工具提升代码生成效率,结合mcp、mdc等能力优化上下文支持能力,实现从需求分析、组件设计到页面搭建的研发全流程与AI能力结合; 2、 结合同花顺大模型等相关AIGC技术,参与全球内容平台系统开发,建设国内外资讯、视频等海量内容全品类全市场内容接入、智能审核、识别理解等能力,基于算法及分发策略实现Feeds、社区、问财等金融场景的信息精准分发,构建内容从生产、理解到分发的全生命周期链路,持续完善内容运营平台能力支撑国内及国际资讯业务发展; 3、参与我们的NLP及其大模型应用落地项目,包括但不限于算法设计、数据标注和模型优化;基于大模型进行内容创作平台开发,利用大模型的语义理解能力、AI绘图能力和我们丰富的数据优势,针对金融场景进行自动化的文章创作及对热门事件深度解读,支撑国际化金融场景;

logo of xiaohongshu
社招3-5年模型标注

1、 独立刻画出符合当前业务场景需求的安全数据体系,包括不限于常规的审核风险体系、生态风险体系等。 2、协同算法设计模型数据策略方案,涵盖专项、非专项安全场景下安全数据训练策略。 3、从模型的数据样本建设、评测体系设计、安全标注自动化升级等,能从模型底座能力上解决策略、模型在用户问题上带来的误伤,漏放。 4、有比较强的agent协同理解,同时具备一定PE技巧,推动安全在各类问题上以自动化形式解决,搭建安全PE-workflow,提升各团队工作效能。 5、能够和算法讨论出适配于不同场景下模型的安全能力(基于数据本身),需要协助算法做好问题分析、数据筛选、策略过滤、模型效果验证。

更新于 2025-08-25