小红书内容安全算法工程师-大模型/商业化大模型方向
任职要求
1、计算机/数学/统计学/模式识别相关专业,本科以上学历 2、有大模型训练和应用背景,熟练掌握CV/NLP/多模态、机器学习、数据挖掘中一项或多项,能够对业务问题进行技术方案拆解,同时具备较强的工程实现能力 3、具备跨部门沟通和协调能力,与产品、运营等部门进行沟通和协调的能力,保障定义清晰、落地到位 4、具备较强分析能力,能够结合业务场景快速建模和设计算法,分析算法的不足并提出解决方案 5、具备广告审核、内容生态、内容安全、内容分发等领域工作经验者优先
工作职责
1、围绕内容安全场景,应用大模型/NLP/CV/多模态算法能力进行内容理解,构建内容风险标签体系,降低内容违规风险 2、负责大模型/NLP/CV/多模态相关算法研发,面向但不限于大模型内容理解和生成、多模态检索、细粒度分类、人脸识别、目标检测等,时刻follow与探索前沿技术 3、深入小红书丰富的业务场景,结合实际需求进行技术落地和创新,构建商业化广告审核体系
1、围绕商业化广告,应用大模型/NLP/CV/多模态算法能力进行内容理解,构建内容风险标签体系,降低内容违规风险 2、负责大模型/NLP/CV/多模态相关算法研发,面向但不限于:大模型、多模态检索、细粒度分类、人脸识别、目标检测、分割、语义理解等等(以上方向擅长一个即可),时刻follow与探索前沿技术 3、深入小红书丰富的业务场景,结合实际需求进行技术落地和创新,构建商业化广告审核体系
商业信任与安全算法团队,聚焦于通过人工智能技术(包括但不限于NLP/CV/多模态/图/大模型)识别和治理问题广告内容和问题广告主,减少虚假宣传、不良暗示等内容,提升广告质量。该方向也是全球内容生产平台共同面对且长期研究的方向,在这里你可以在字节跳动商业化海量的文本、图像、视频、广告主、关联关系等数据基础上构建机器学习系统,深耕算法优化,为商业化各业务提供安全解决方案。 1、数据工程:构建高质量数据的生产流程,其中包括预训练、指令微调等数据,提升业务应用效果; 2、算法研发:推进Knowledge Injection、SFT、RLHF等模型优化方面的工作,提高模型质量和适应性; 3、梳理&沉淀算法库:抽象算法接口,最大化提升算法成果和基座模型的复用率,提升大模型落地效率; 4、业务应用:深入研究并推进相关大模型技术的落地,包括但不限于智能审核、客服、Copilot等应用场景。
商业信任与安全算法团队,聚焦于通过人工智能技术(包括但不限于NLP/CV/多模态/图/大模型)识别和治理问题广告内容和问题广告主,减少虚假宣传、不良暗示等内容,提升广告质量。该方向也是全球内容生产平台共同面对且长期研究的方向,在这里你可以在字节跳动商业化海量的文本、图像、视频、广告主、关联关系等数据基础上构建机器学习系统,深耕算法优化,为商业化各业务提供安全解决方案。 1、数据工程:构建高质量数据的生产流程,其中包括预训练、指令微调等数据,提升业务应用效果; 2、算法研发:推进Knowledge Injection、SFT、RLHF等模型优化方面的工作,提高模型质量和适应性; 3、梳理&沉淀算法库:抽象算法接口,最大化提升算法成果和基座模型的复用率,提升大模型落地效率; 4、业务应用:深入研究并推进相关大模型技术的落地,包括但不限于智能审核、客服、Copilot等应用场景。
商业信任与安全算法团队,聚焦于通过人工智能技术(包括但不限于NLP/CV/多模态/图/大模型)识别和治理问题广告内容和问题广告主,减少虚假宣传、不良暗示等内容,提升广告质量。该方向也是全球内容生产平台共同面对且长期研究的方向,在这里你可以在字节跳动商业化海量的文本、图像、视频、广告主、关联关系等数据基础上构建机器学习系统,深耕算法优化,为商业化各业务提供安全解决方案。 1、探索并落地超大规模多模态大模型,在业务场景做深度适配和极致优化; 2、参与多模态大模型多体裁内容数据链路建设、指令微调、偏好对齐、模型优化全流程实践; 3、将多模态大模型应用于图像/视频/文本内容理解(比如视频分类、视觉问答、跨模态检索、多模态表征)、交互、生成、逻辑推理等领域; 4、跟踪调研多模态大模型以及相关方向(包括但不限于CV/NLP/多模态/Agent)的前沿技术; 5、深入研究和探索多模态大模型在更多未来生活场景中的应用。