小红书大模型数据运营专家（预训练方向）

社招全职1-3年模型标注2025-12-23地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

1. 硕士及以上学历,计算机、计算语言学、数据科学、信息检索、NLP相关专业优先;有预训练语料处理、大规模数据工程经验者优先。 
2. 1年以上大模型预训练数据策略运营/产品经验,了解通用预训练数据处理流程。 
3. 具备优秀的数据分析能力,能通过Loss曲线、…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 预训练语料策略与体系搭建，负责大模型预训练阶段的数据策略，覆盖通用语料、垂直领域语料的全流程数据方案设计。 
2. 主导数据评估：建立清晰可量化的数据评估标准，提高评估效率；验证数据有效性，推动模型迭代； 
3. 数据驱动的模型迭代，深度理解预训练技术原理，通过数据分析定位模型能力短板，制定针对性数据补充策略，推动模型技术迭代升级。 
4. 前沿探索，保持对开源模型（如DeepSeek、Qwen等）及学术前沿的敏锐度,沉淀可复用的数据方法论,为团队提供中短期数据策略规划。 
5. 与算法、技术团队合作开发数据工具链，主动发现问题，发起项目，管理数据生产团队,把控数据质量与项目进度,推动跨团队高效协作,确保数据按时高质交付。 
6. 主导垂直领域语料体系的从0到1搭建（包括但不限于人文/学科/code等体系），能够定义各体系的质量标准，并设计可量化的评估指标。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

数据科学+

信息检索+

还有更多 •••

登录查看完整学习资料

相关职位

大模型数据运营专家（VLA方向）-大模型数据服务中心

社招A201420

1、与顶尖算法团队紧密协作，深入理解VLA模型训练方法，负责具身智能数据采集、清洗、标注、评估生产管理全流程，包括视觉、敏锐度、运动等多模态数据，提供数据支持和建议； 2、定义并规划数据采集、标注标准与高效执行流程，主导采标平台设计和优化，确保数据处理的高效性和稳定性； 3、引入主动学习、自动标注、仿真数据合成等技术手段，大幅提升数据采集标注效率与数据价值密度，为模型训练提供高质量数据支撑。

更新于 2025-12-17北京

AI数据运营专家-大模型数据服务中心

社招1-3年A31083A

1、负责部分训练数据清洗、预处理管道的维护工作，为模型训练奠定基础； 2、编写高质量、模块化、可测试的Python代码，并严格遵循代码规范； 3、负责实现并维护大模型评测过程中的评估指标（如各种自定义评估任务）； 4、参与日常尺度拉齐、执行监督纠偏等工作，对技术方案落地负责； 5、扎实的线上问题排查能力，擅长阅读和分析复杂的系统/应用日志，能够快速从报错信息中定位到核心问题。

更新于 2025-10-14上海

多模态大模型数据运营专家-【可灵AI专项】

社招1-3年J0005

1、数据策略制定与规划，与算法团队深度协同，负责多模态数据生产的规划与项目交付； 2、数据产线搭建、运行、交付与质量保障，设计数据产线，确保项目按计划、高质量交付，对最终交付结果负责；有系统性的数据运营方法论，通过建立深度的质量监控与反馈机制，确保生产效率与数据准确性； 3、持续优化数据生产的流程，沉淀最佳实践，不断优化效率与质量； 4、层次级的数据专家资源生态的搭建与管理，基于项目需求制定合理的任务定价、结算规则和资源数量规划； 5、成本投入策略设定与风险控制，实现项目成本的精细化运营，有效进行项目规划、风险预警与管理。

更新于 2026-05-26北京

晓天衡宇-大模型数据生态资源运营-专家运营

社招3年以上

1. 专家项目全生命周期管理：负责内部专家资源池的日常运营与维护，包括专家的招募、准入、分级、履约跟进与关系维护；对接内部专家，主导专家项目从立项、启动、执行到交付的全流程推进，确保项目按节点、按质量、按预算达成目标。 2. 内部运营活动的设计与落地：围绕专家生态与业务目标，策划并执行面向专家的运营活动；独立完成活动方案设计、资源协调、执行落地、数据回收与效果评估，持续提升内部专家活跃度、满意度与产出质量。 3. 项目复盘与结算：主导项目结项工作，包括交付验收、专家履约评价、费用核算与结算流程跟进；沉淀项目复盘报告，输出可复用的 SOP、案例库与运营方法论，为后续项目提供数据与经验支撑。 4. 过程风险管控：识别项目过程中的进度、质量、合规、预算及舆情等潜在风险，建立风险预警机制；针对异常情况快速响应、协调资源解决，并向上同步关键信息，保障项目稳定运行。 5. 跨团队协作与支持：与业务、产品、法务、财务、内控等团队紧密协作，推动流程优化与机制建设；定期输出运营数据看板与经营分析，为业务决策提供依据。

更新于 2026-07-21杭州