logo of xiaohongshu

小红书社区模型标注-大模型数据运营专家

社招全职1-3年模型标注地点:北京 | 上海 | 武汉状态:招聘

任职要求


1. 硕士及以上学历,语言学、计算语言学、语用学、心理学、汉语言等相关专业优先;
2. 2-3年文本/多模态大模型数据方向实战经验,熟悉数据合成、处理及语料库建设;
3. 有大语言模型任务设计和标注的科研或工作经历者优先,有语义学/语用…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责大模型后训练阶段的数据策略,包括SFT、RLHF、DPO等对齐方法所需的数据,方向包含文本/多模态数据构建,设计全流程数据方案与策略,制定质量标准,搭建高效高质数据生产pipeline,有效提升技术预研和模型效果提升;
2. 深度理解大模型技术与产品,制定针对性数据策略,为模型效果突破提供专业建议,推动技术迭代升级;
3. 统筹协调上下游项目资源,对接算法团队需求,把控数据质量与项目进度,推动跨团队协作,确保目标高效达成。
包括英文材料
学历+
大模型+
还有更多 •••
相关职位

logo of bytedance
社招A209514A

1、基于产品研发运营和业务需要,在内容垂类方向产出高质量文本数据,用于相关大模型训练; 2、参与大模型垂类数据标注标准的制定和优化,在既定标注标准下,完成相关数据的生产任务,总结抽象各类问题,反哺产品、研发、运营及业务,持续优化、细化标注标准,保障数据质量; 3、对数据生产方法进行探索,推动尝试,持续提升标注数据的准确性和生产效率。

更新于 2025-01-24北京
logo of 10jqka
校招研发技术类

1. 结合同花顺大模型等相关AIGC技术,参与全球内容平台系统开发,建设国内外资讯、视频等海量内容全品类全市场内容接入、智能审核、识别理解等能力,基于算法及分发策略实现Feeds、社区、问财等金融场景的信息精准分发,构建内容从生产、理解到分发的全生命周期链路,持续完善内容运营平台能力支撑国内及国际资讯业务发展; 2. 参与我们的NLP及其大模型应用落地项目,包括但不限于算法设计、数据标注和模型优化;基于大模型进行内容创作平台开发,利用大模型的语义理解能力、AI绘图能力和我们丰富的数据优势,针对金融场景进行自动化的文章创作及对热门事件深度解读,支撑国际化金融场景; 3. 理解并评估NLP特别是大模型方向的最新论文及技术成果,帮助团队保持对国际当前前沿研究动态的了解,与团队合作,将研究成果用于提升同花顺国内国际相关金融场景产品能力;

杭州
logo of 10jqka
校招研发技术类

1、探索AI技术在前端开发中的应用,共同研究如何通过Cursor、Cline、Lovable等工具提升代码生成效率,结合mcp、mdc等能力优化上下文支持能力,实现从需求分析、组件设计到页面搭建的研发全流程与AI能力结合; 2、 结合同花顺大模型等相关AIGC技术,参与全球内容平台系统开发,建设国内外资讯、视频等海量内容全品类全市场内容接入、智能审核、识别理解等能力,基于算法及分发策略实现Feeds、社区、问财等金融场景的信息精准分发,构建内容从生产、理解到分发的全生命周期链路,持续完善内容运营平台能力支撑国内及国际资讯业务发展; 3、参与我们的NLP及其大模型应用落地项目,包括但不限于算法设计、数据标注和模型优化;基于大模型进行内容创作平台开发,利用大模型的语义理解能力、AI绘图能力和我们丰富的数据优势,针对金融场景进行自动化的文章创作及对热门事件深度解读,支撑国际化金融场景;

杭州
logo of xiaohongshu
社招1-3年模型标注

1.大模型与数据技术融合: 基于业务场景,通过大模型微调训练(Fine-tuning)、提示词工程(PE)及RAG技术等,驱动数据生成/合成/预标方案的创新落地;搭建从数据圈选、处理到交付的全链路自动化能力,支撑智能标注与业务闭环,提升数据服务效率 2.数据工程效能升级: 开发自动化生成/合成/预标工具链,结合大模型能力优化标注流程,提升数据标注效率与模型训练ROI,降低人工投入成本 3.技术方案与项目管理: 主导数据生成/合成/预标方案的技术实现路径探索及验证(如人机协同标注、Auto PE),推动跨团队协作与规模化落地

更新于 2025-09-09武汉|北京