小红书【REDstar】NLP/多模态内容理解算法工程师-社区治理
任职要求
1、本科及以上学历,计算机等相关专业优先; 2、熟悉 Python,具有较强的代码开发和实现能力,熟练掌握Pytorch、TensorFlow等至少1种主流深度学习框架,能熟练使用 Linux; 3、在多模态大模型…
工作职责
1、负责优化小红书的生态算法,利用多模态内容理解、CV以及NLP相关能力,解决笔记、账号、交易、直播等多体裁的生态风险,融合笔记/视频/评论/账号等多维度特征,建设并优化生态领域的大模型; 2、负责包括但不限于大规模预训练模型、数据挖掘,内容理解特征体系,持续优化并时刻保持技术先进性,将业界SOTA模型落地并改进以获取生态业务线上收益; 3、紧密关注相关领域业界的最新进展,通过LLM/MLLM建模达成生态业务的机审能力,提高机审风险覆盖度和风险召回能力; 4、建立并优化生态场景下的内容理解特征体系,完善相关技术基建,并实现对外服务能力。
1、负责小红书App社区(主站)的推荐、搜索、交易、增长、直播等业务场景的技术探索,能够从复杂的业务环境中抽象出清晰具体的技术问题,并将大模型、机器学习等技术有效应用于小红书App社区建设上,与各部门(包括并不限于产品,基础技术等)的同事一起深入交流合作,共同迭代和优化社区产品,提升亿级用户体验,Inspire Life; 2、构建小红书App社区(主站)的内容、用户之间的生产、关系、分发、消费机制,利用Query理解、多模态内容理解、相关性/召回/排序算法、深度学习、因果推断、迁移学习、跨域表征、多任务学习、图网络、运筹学、博弈机制等技术,持续建设图文&视频内容的大规模推荐/搜索/交易/知识生产等系统,通过策略和模型优化不断提升实现SOTA效果。
1、负责优化小红书的多模态内容理解大模型算法,利用LLM、VLLM、Embedding、CV以及NLP相关能力,解决社区/大商业中笔记、评论、账号等多体裁的审核问题;优化小红书综合机审大模型; 2、负责包括但不限于预训练、SFT、RL、多模态表征、Agent搭建、AutoPE、RAG等,持续优化并时刻保持技术先进性,将业界SOTA模型落地并改进以获取审核业务线上收益; 3、紧密关注相关领域业界的最新进展,通过LLM/MLLM不断优化生态业务的机审能力,提高机审风险覆盖度和风险召回能力。建立并优化生态场景下的内容理解特征体系; 4、跟踪大语言模型、多模态、强化学习等算法的最前沿进展,探索其在小红书审核业务中的落地方案。
创作发布算法方向: 1、负责图像编辑、视频剪辑、文案创作等内容创作相关算法的研发与优化,并在社区发布、商业化&电商创作等场景落地; 2、跟进多模态大模型内容生产、Agent等相关技术的最新发展趋势,保持技术先进性,持续探索Agent在内容创作方面的潜力。 内容理解方向: 1、负责多模态内容理解、图像理解以及NLP相关的算法研发工作,提升搜索、广告、推荐、创作发布的效果和体验; 2、负责包括但不限于多模态大模型Pre/PostTrain、数据挖掘,持续优化并突破业界SOTA效果,兼具落地以获取业务线上收益; 3、紧密关注相关领域业界的最新进展,时刻保持技术先进性,探索前沿技术的落地结合点。 AIGC生成方向: 1、负责多模态生成/GAN/Diffusion等图像&视频生成相关算法研发与优化, 跟进该领域的前沿技术研究; 2、参与技术规划制定, 跟进图像&视频生成技术最新发展趋势,打造业内领先的多模态内容生成能力。; 3、推动技术在图像&视频编辑/素材生成/辅助设计/特效等领域的应用。