字节跳动大模型安全运营专家-Data
任职要求
1、有人工智能或技术平台服务经验者优先,有比较强的客户服务意识;
2、熟悉用户研究和市场分析方法,能够运用数据分析工具进行用户行为分析;
3、出色的沟通技巧和人际交往能力,能够与用户和团队成员建立良好的关系;
4、具备…工作职责
1、整体负责海外大模型业务内容安全策略,能够通过对业务场景的深度分析,打造符合方舟自己的海外内容安全策略; 2、内部定模型准入标准,所有的模型符合这个内容安全的标准后才可以上线; 3、外部定沟通口径,负责销售/商务反馈的关于内容安全问询的应对、海外媒体的应对; 4、总结客户诉求,来对内部模型和模型外部策略提出要求,与安全产品、技术紧密协作,推进对应的产品或者方案落实; 5、持续发现与挖掘新增问题,并进行问题刻画,不断扩大策略覆盖面,搭建”风险发现→风险研判→风险刻画→标准执行”的完整运营流程机制; 6、了解海外各国的AIGC内容安全策略以及商业化策略,实时关注和解读海外各区域的安全政策从而保持产品的合规性。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、负责规模化运营外包专家团队,制定和优化人工评估流程和标准,对专家评估结果进行质量把控,进行数据分析,撰写评估报告,为模型优化提供可靠依据; 2、搭建自动评估和标注体系,编写PE和Workflow程序,实现评估数据的规模生成与筛选,协同产品研发团队完成自动评估系统搭建与优化; 3、制作自动评估的评测集,从多样性、时效性、真实性、区分度等维度,保障评测集的质量,辅助研发快速迭代。
1、负责蚂蚁全站数据研发平台Dataphin实时相关体系建设,包括通用+智能(流批一体,Codeless)研发平台,质量保障平台,支撑智能化商业决策和运营,让数据快速释放价值; 2、负责蚂蚁全站数据研发平台Dataphin基础设施相关体系建设,保障全站用户稳定,高效,安全进行数据生产建设; 3、负责蚂蚁集团受控加工平台的应用架构设计和系统实施,通过体系化并具有前瞻性的能力建设,确保研发时即受控保障、事前可灰度观测、事中可观测预警、事后可应急快恢,使得数据三板斧和数据SLA在蚂蚁数据域全面落地。
1、负责蚂蚁全站数据研发平台Dataphin实时相关体系建设,包括通用+智能(流批一体,Codeless)研发平台,质量保障平台,支撑智能化商业决策和运营,让数据快速释放价值; 2、负责蚂蚁全站数据研发平台Dataphin基础设施相关体系建设,保障全站用户稳定,高效,安全进行数据生产建设; 3、负责蚂蚁集团受控加工平台的应用架构设计和系统实施,通过体系化并具有前瞻性的能力建设,确保研发时即受控保障、事前可灰度观测、事中可观测预警、事后可应急快恢,使得数据三板斧和数据SLA在蚂蚁数据域全面落地。
将大模型能力做成可上线、可迭代、可控成本的产品能力。通过打造数据飞轮、模型适配与后训练、评测与实验等关键手段,实现端到端的闭环交付,持续提升产品的效果与稳定性。 具体职责包括以下相关方向的一项或多项:包括语言大模型(LLM)应用后训练与智能体优化、多模态大模型(VLM/MLLM)应用后训练与智能体优化,以及图像、视频、语音、文档等场景下的 AIGC 能力构建与生成效果优化。 需求与问题定义 深入业务与产品共创需求,深入业务与产品共创需求,将文本、图像、视频、语音、文档等场景诉求转化为可执行的 AI 任务定义,明确目标、边界、优先级与验收口径。 方案与应用架构 在Prompt、RAG、微调、Agent等路线间做技术选型与权衡,设计端到端应用架构(含上下文、工具调用、记忆、权限与安全),并完成RAG、Multimodal RAGMemory、Tool Use、多Agent等能力的工程化落地与生产级集成。 数据飞轮与治理 搭建高效的数据采集、清洗与标注工程流水线。前瞻性地探索合成数据与模型自标注等自循环策略,同时建立完善的数据版本追踪与质量评估体系,真正打通“模型训练-业务应用-用户反馈-数据迭代”的增强回路。 模型适配与后训练 主导基座大模型向顶尖垂直行业专家的后训练的全链路技术演进,包括高质量的SFT、RL阶段PPO、GRPO等前沿强化学习与偏好优化算法攻坚,全面突破模型在复杂业务场景下的指令遵循精度、极致可控性与长链路逻辑推理天花板,显著提升大模型在复杂业务场景下应用能力。 评测体系与实验 面向业务目标设计评测指标与Rubric,搭建自动化评测框架(含人工评审),建立离线基准与线上实验体系(A/B、Bandit),持续监控指标漂移与策略投机以防止效果退化。 生产交付与运营 负责系统集成与上线发布,对线上质量、稳定性与成本负责,建立监控、告警、兜底与人工接管机制,推动持续迭代。