
搜狐大模型算法应用实习生(内容安全与社区应用方向)
任职要求
1、硕士及以上学历(2027年及以后毕业),计算机、电子信息、人工智能、数学等相关专业,具备扎实的算法与数据结构功底; 2、掌握扎实的数据结构与算法基础,至少熟练使用一门编程语言(Python/Go/C++/Java 等); 3、具备Agent/RAG…
工作职责
1、探索多模态大模型在视频、图像、文本内容的理解能力,构建场景化模型,提升风险识别准召率; 2、研究UGC文本/图像拒绝理由的可解释性归因方法,推动人机协同审核应用落地; 3、构建大模型在风险防控等场景的垂类内容理解能力,优化模型对抗性及迭代效率; 4、开发视频、图文向量化表征技术,提升跨模态检索能力(如视频索引、图文相似性检索); 5、推动大模型在业务系统中的落地。
1.负责评论维度方向模型的训练和基础系统性能的优化 2.利用自然语言,多模态等技术,从海量内容中识别风险用户与内容 3.跟踪行业最新动态,推进新算法的落地与应用
支持公司内容安全、业务风控、信息安全的平台建设和风险管理工作。通过AI算法、大数据、情报攻防和终端安全灯多领域交叉技术建设安全风控平台,为数亿小红书用户提供安全健康的社区环境,同时保障电商、直播等业务的健康发展 1.负责用户维度方向模型的训练和基础系统性能的优化 2.利用计算机视觉,自然语言,多模态等技术,从海量内容中识别风险用户与内容 3.跟踪行业最新动态,推进新算法的落地与应用
团队介绍:抖音内容理解团队负责抖音集团内容算法工作,业务覆盖抖音、今日头条、西瓜视频、剪映等业务,承接业务在内容理解、LLM应用、新业务方向探索等方向的工作。技术上涵盖了CV,NLP,音频,LLM等算法方向。团队承载业务需求同时还负责底层基础算法技术,推动如基础预训练模型、视频生成等学术和专利相关工作,负责为抖音各个技术方向提供长期有深度的技术支撑。得益于抖音集团业务数量庞大的多模态业务数据和业务需求,团队能够有资源和机会去做出行业领先的技术创新,用最新的技术去改变影响用户和改变行业格局。 1、课题背景:随着大模型技术在多模态内容理解领域的突破,内容特征已逐渐替代传统ID特征成为推荐系统的核心驱动力。然而当前系统面临三重挑战:(1)内容深度解析需求:短视频、直播、评论等场景需要同时处理文本、图像、音频等多模态数据,且需建模用户长短期兴趣与跨领域行为;(2)动态安全威胁:评论区涌现多模态越狱攻击(如隐晦图文组合提示词),传统单模态审核无法应对复杂对抗场景;(3)跨域迁移瓶颈:用户娱乐内容兴趣与电商消费需求间存在语义鸿沟,需建立可解释的跨域映射机制。 2、课题挑战:(1)多模态复杂性:用户行为涉及多模态交互(如视频+评论+购物),需统一框架实现内容理解与用户意图推理;(2)社区生态动态性:自然作者、各种机构、黑灰产等群体会互相交互产生大量复杂的多模态行为,要求算法能够快速准确的理解内容和交互的语义;(3)生态协同需求:DAU-GMV转化率存在成倍提升空间,需突破"娱乐到消费"的跨域兴趣建模技术;(4)技术整合价值:联合优化推荐、安全、跨域三大模块,可降低算力消耗并提升端到端效果。 3、研究方向:大语言模型、多模态大模型、内容理解、推荐系统。
团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok研发团队,旨在实现TikTok业务的研发工作,搭建及维护业界领先的产品。加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,支持产品在全球赛道上高速发展;也能接触到包括服务架构、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。在这里,团队专业且纯粹,合作氛围平等且轻松。目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 为什么加入我们 与团队共同激发创造:创造是 TikTok的核心。不管对于TikTok产品还是团队本身,我们都希望能激发更多想象力,为自己、平台、我们所服务的社区以及社会带来更多价值和影响。 在有挑战的事中成长:在TikTok,你能够参与非常有挑战性的项目,一起做出突破行业、有全球影响力的事。这里有数以亿计的用户,在等你用新技术、新想法为他们带来新的体验。我们从不安于现状,对我们来说,每一个挑战,无论多么困难,都是一个学习、创新、和成长的机会。 工作方式和文化:我们鼓励务实解决实际问题、在每件事上追求极致,希望大家始终像“创业第一天”那样做事。 公司文化多元兼容,同事之间像同学一样平等相处,机制敏捷灵活,希望更好地激发每个人的创造力。 优秀的人能获得认可与回报:优秀人才能够和公司共同成长,什么时候加入都不晚。我们也进一步加大了激励区分度,让优秀的人得到认可和回报、承担更多重要项目,充分发挥潜能,脱颖而出。 欢迎加入我们! 课题介绍: TikTok作为全球领先的短视频平台,面临新用户数据稀疏导致的个性化推荐不足、直播推荐时效性要求高、用户兴趣多样性维护困难以及电商推荐系统链路复杂等多重挑战。传统推荐方法依赖历史行为建模,难以解决新用户冷启动问题,且直播推荐需在极短窗口期内(通常30分钟内)实时捕捉内容动态变化(如主播互动、流量波动),这对系统的实时感知与快速决策能力提出更高要求。此外,单列沉浸式场景放大了多样性问题,需平衡多峰兴趣学习与探索引发的内容穿越风险。当前电商推荐系统采用多阶段漏斗架构(召回-排序-混排),存在链路不一致、维护成本高、过度依赖短期价值预测等问题,导致用户易陷入内容同质化疲劳。 针对上述痛点,项目提出结合大语言模型(LLM)和大模型技术实现突破:一方面利用LLM的海量知识储备与Few-shot推理能力,通过注册信息与外部知识推理新用户潜在意图,缓解冷启动问题;另一方面,在社交偏好建模中融合GNN与用户全生命周期行为序列,提升兴趣预测精准度。同时,探索大模型的泛化能力、长上下文感知及端到端建模优势,简化电商推荐链路,增强实时动态适应性与兴趣探索能力,最终实现系统更简洁、推荐更精准、用户体验与留存双提升的目标,推动业务可持续增长。 1、负责TikTok最核心的业务推荐算法工作,与来自国内外顶级名校、有丰富业界经验的同学合作,共同搭建行业顶尖的推荐系统,为用户提供一流的产品体验; 2、将最前沿的机器学习技术应用到国际化短视频的核心场景业务,包括混排/排序/多目标/召回/冷启动/探索/多样性/内容理解等等场景,不断优化用户体验,促进业务发展; 3、研究方向包含且不局限于:深度学习、图神经网络、多任务学习、排序学习、模型压缩和加速、多模态技术等,结合业务的实际问题来做好技术的探索和研究; 4、和产品、运营团队紧密合作,通过对产品和用户的深入理解和分析,制定算法策略促进短视频生态的长期繁荣发展。