小红书社区模型标注-AI安全模型数据运营
社招全职3-5年模型标注地点:北京 | 上海状态:招聘
任职要求
1、本科及以上学历,计算机、统计学等理科学科优先; 2、拥有3年以上安全模型设计、训练、部署调试经验优先; 3、了解大模型原理,熟悉大模型的训练、优化迭代链路; 4、掌握prompt撰写、应用和优化技巧,深度理解agent原理,能够将安全策略与技术结合起来,实现人机协同作业;
工作职责
1、 独立刻画出符合当前业务场景需求的安全数据体系,包括不限于常规的审核风险体系、生态风险体系等。 2、协同算法设计模型数据策略方案,涵盖专项、非专项安全场景下安全数据训练策略。 3、从模型的数据样本建设、评测体系设计、安全标注自动化升级等,能从模型底座能力上解决策略、模型在用户问题上带来的误伤,漏放。 4、有比较强的agent协同理解,同时具备一定PE技巧,推动安全在各类问题上以自动化形式解决,搭建安全PE-workflow,提升各团队工作效能。 5、能够和算法讨论出适配于不同场景下模型的安全能力(基于数据本身),需要协助算法做好问题分析、数据筛选、策略过滤、模型效果验证。
包括英文材料
学历+
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
Prompt+
https://cloud.google.com/vertex-ai/generative-ai/docs/learn/prompts/introduction-prompt-design
A prompt is a natural language request submitted to a language model to receive a response back.
https://learn.microsoft.com/en-us/azure/ai-foundry/openai/concepts/prompt-engineering
These techniques aren't recommended for reasoning models like gpt-5 and o-series models.
https://www.youtube.com/watch?v=LWiMwhDZ9as
Learn and master the fundamentals of Prompt Engineering and LLMs with this 5-HOUR Prompt Engineering Crash Course!
AI agent+
https://www.ibm.com/think/ai-agents
Your one-stop resource for gaining in-depth knowledge and hands-on applications of AI agents.
相关职位
社招A113246
1、数据管理及运营,负责模型数据的质量把控及数据集构建全流程管理; 2、工作协同,积极配合算法、业务及项目负责人,协同完成模型的规划、训练、上线及效果监控; 3、项目管理,管理所负责模型或项目的进度、质量、收益等,对项目成员及结果负责; 4、通过数据分析模型表现,及时反馈问题,针对性提出解决方案,确保项目各项指标符合预期; 5、参与制定项目标准,并不断优化流程,提升项目交付质量。
更新于 2025-06-04
社招A226453
1、数据管理及运营,负责模型数据的质量把控及数据集构建全流程管理; 2、工作协同,积极配合算法、业务及项目负责人,协同完成模型的规划、训练、上线及效果监控; 3、项目管理,管理所负责模型或项目的进度、质量、收益等,对项目成员及结果负责; 4、通过数据分析模型表现,及时反馈问题,针对性提出解决方案,确保项目各项指标符合预期; 5、参与制定项目标准,并不断优化流程,提升项目交付质量。
更新于 2025-06-04
实习审核策略
1、学习并熟悉内容审核全流程,协助把控内容安全风险,通过数据分析持续优化审核策略,对策略效果及审出率进行追踪和反馈; 2、参与各项内容治理专项项目,协助制定项目目标和解决方案,协调审核规则、人力、质检等团队推动项目顺利落地; 3、支持业务策略迭代工作,包括数据标注与分析、违禁词挖掘、风险内容特征识别等,参与违规案例分析,协助制定相应策略并跟进模型优化落地。
更新于 2025-09-12