小红书LLM算法实习生(创意生成)
任职要求
1. 计算机、数学、物理、统计学等相关专业硕士研究生及以上学历。 2. 熟悉自然语言处理(NLP)或者图像处理(CV)的理论和实践,在广告创意生成、AIGC等领域有经验者优先。 3. 拥有扎实的编程能力,熟练使用Python、C++等编程语言,熟悉常见的数据结构和算法。 4. 专业领域有以下任意即可: a.图像生成:掌握StableDiffusion、Sta…
工作职责
1. 负责小红书站内搜索广告智能创意,在搜索场景下对小红书站内广告文案、视频、图片等素材进行内容理解,并生成投放高竞争力素材,提高转换效率。 2. 负责广告创作平台的算法能力优化,利用算法能力为广告主提供投前、投中、投后各类洞察或者提效功能。 3. 追踪业界创意、多模态及Generative AI方向最新技术,落地应用并提升广告创意理解、自动生成和优化等场景的效果。
1、负责通过基于大语言模型及多模态大模型的微调、prompts调优、指令构建及演化技术,将大模型的生成、理解、交互能力在公司核心业务场景应用落地,包括但不限于AIGC创意生成、视频处理、智能化特效、智能对话、代码生成、音视频传输、电商场景内容理解等; 2、负责LLM及多模态大模型的应用中台及相关技术模块搭建,包括但不限于Agents 、RAG、 function call、system prompts等,探索大模型应用前沿及新兴应用场景; 3、跟踪行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践; 4、了解业务,与公司各技术团队密切配合,能与产品、运营等角色高效沟通需求和目标,发挥自己的主观能动性,设计技术解决方案,培养自己的良好的业务sense和综合素质。
1. 探索LLM前沿领域研究,包括但不限于数据集建设、模型预训练、模型蒸馏、迁移学习、逻辑推理、智能体、MoE、Scaling law和模型评估等工作。 2. 负责优化和提升LLM对齐效果,包括数据质量优化、指令微调、奖励模型优化、强化对齐、策略迭代等,提高算法的效率和性能。 3. 参与LLM在AI虚拟人、AI评论生成、AI广告创意生成、LLM4Rec等业务场景的应用工作。
【课题说明】 信息流广告系统一般采用“召回->粗排->精排->出价->拍卖”的多级漏斗架构,但各模块独立优化导致优化目标不一致,前链路会制约后链路上限,漏斗效率折损大。 近年来,随着大模型和生成式技术的快速发展,其强大的表征能力和良好的Scaling性质也为广告系统提供了新的可能性。本研究旨在探索如何利用生成式技术重塑整个广告系统,通过一个端到端的生成式广告大模型完成所有决策,打破多级漏斗框架,打开模型决策空间,最大化平台收益。 【建议研究方向】 1.生成式广告大模型架构设计:基于前沿大模型(如时空Transformer、MLA、MoE等),设计适配广告场景的生成式决策框架,支持根据“用户行为、实时位置、商户出价”端到端生成最优的广告商家、展示创意、相应计费。 2.多阶段的训练范式设计:借鉴LLM的分阶段训练技术(如PT、SFT、RLHF等),设计“基于海量交互的 pre-training 和 基于业务目标的 post-training ”的分阶段训练范式,提升广告大模型效果。 3.广告大模型的Scaling规律探索:探索广告场景下,生成式大模型“算力->效果”的转化规律,驱动推广搜迭代范式实现由“人工设计迭代”到“算力堆叠迭代”的跃迁。