快手多模态内容理解推荐工程师
任职要求
1、硕士及以上学历,对音视频前沿技术有浓厚兴趣,对音视频技术和海量数据推荐的结合有兴趣; 2、有自己独立的想法和判断,能够快速复现学术界最新成果; 3、编程基础扎实,熟练掌握C++/Python,熟悉Pytorch、TensorFlow等训练框架; 4、乐于沟通,善于向他人学习,追求不断…
工作职责
1、利用预训练模型和大模型技术, 深入分析快手业务中的图像、视频、文本等多模态内容,提升在线推荐效果; 2、参与亿级用户规模的视频推荐优化,通过特征添加、设计结构、优化学习算法, 持续提升推荐效率, 优化点击、转化、打赏、下单等核心营收指标。

我们正在寻找充满热情、具备深厚研究潜力的应届毕业生加入我们,共同探索下一代推荐系统的边界。你将置身于推荐领域的最前沿,不仅解决当下的业务挑战,更致力于定义未来的推荐范式,将最新的学术突破转化为具有重大影响力的用户产品体验。 : 1.参与搜狐新闻App核心召回、排序、混排、冷启动等关键推荐算法模块的研发、优化与持续迭代, 直接提升新闻推荐的精准性、个性化和用户体验; 2.聚焦大模型驱动推荐、多模态内容理解与推荐、强化学习/序列决策推荐、多智能体协同推荐等前沿方向,开展深度研究与创新实验,产出具有技术突破性和潜在业务颠覆性的研究成果; 3.负责将前沿推荐算法研究成果(如新模型、新策略、新机制)在真实业务场景中进行快速原型验证与工程化实现,评估其实际性能与可行性,推动关键技术在实际推荐系统的落地应用; 4.紧密追踪国际顶级会议(如 KDD, WWW, RecSys, NeurIPS等)在推荐系统、机器学习及相关领域的最新进展,深入解读前沿论文,定期组织内部分享,推动团队技术视野的持续拓展; 5.积极总结研究与实践成果,参与撰写高质量技术报告,并鼓励向顶级学术会议/期刊投稿,提升团队在推荐技术领域的学术影响力和技术品牌;
多模态推荐算法工程师 (影像Agent方向) 1. 负责影像Agent核心推荐模块的设计与落地:深度参与影像Agent的意图理解与服务推荐,利用多模态大模型技术,让Agent能精准预判用户需求,主动推荐拍摄建议、创作玩法等; 2. 打造智能相册的创作推荐引擎:基于对照片、视频内容的多维度理解(如美学、情感、事件),为用户在相册编辑场景中,智能推荐个性化的模板、音乐、滤镜及包装特效,引爆创作灵感; 3. 主导影像社交App的内容分发与推荐:负责vivo旗下影像社交平台的内容推荐流,结合用户行为和多模态内容理解,探索前沿的推荐模型,提升优秀作品的曝光率、分发效率与用户粘性; 4. 探索前沿技术的应用与创新:跟进多模态大模型、生成式推荐、Agent等领域的最新进展,结合业务场景进行技术预研和方案设计,持续构筑vivo在智能影像推荐领域的技术壁垒;
-负责推荐广告场景下文、图、视频多模态内容理解算法研发,从质量、风格、营销特色等维度建设内容理解标题体系 -负责多模态内容理解与推荐广告算法的结合,用于优化广告的体验、召回、排序、点击率转化率预估等环节的效果 -负责大语言模型及生成式AI等业界前沿技术的调研及并应用于内容理解,提升内容理解效果 -负责内容理解领域内新技术调研及创新应用范式的探索