小红书商业化风控算法实习生(NLP/CV/多模态)
任职要求
. 计算机/数学/统计学/模式识别相关专业,硕士及以上学历 2. 熟练掌握CV/NLP/多模态、机器学习、数据挖掘中一项或多项,能够对业务问题进行技术方案拆解,同时具备较强的工程实现能力 3. 具备跨部门沟通和协调能力,…
工作职责
1. 建设AI内容风控体系,应用NLP/CV/多模态算法能力进行内容理解,结合商业化广告审核场景,构建内容风险标签体系,降低内容违规风险 2. 负责NLP/CV/多模态相关算法研发,面向但不限于:多模态检索、细粒度分类、目标检测、语义理解、大模型等等; 时刻follow与探索前沿技术(以上方向擅长一个即可)
拥抱LLM技术,深度改进多模态内容理解技术,应用到小红书商业化广告审核场景中来解决实际业务问题; 1.负责NLP、CV、多模态相关算法研发与落地,包括但不限于笔记图文内容结构化、文本&多模态内容理解、主题发现、信息抽取、命名实体识别、智能摘要、意图理解等; 2.进行大模型前沿技术探索和研发,包含但不限于In-context learning、SFT、RLHF、DPO等,用大模型解决实际的业务场景问题; 3.负责对各业务场景下相关技术问题进行分析、算法设计、研发以及推动上线,提升业务效果;
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:抖音电商算法团队,依托抖音、今日头条、番茄小说、红果短剧等产品,帮助用户发现、讨论并获得好物,享受美好生活;帮助商家高效经营,创建良性商业生态;激励创作并分享购物经验使用心得,构建有真诚有信息的电商内容氛围。在这个团队,我们不仅要通过推荐、广告和搜索算法搭建消费者和商家之间的桥梁,也要通过风控算法和治理算法去甄别违规行为,保护用户的购物体验,保护真正诚信经营的商家;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率,降低商家的经营成本;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户物流体验;另外我们还会用业界先进的数据科学技术为业务健康发展保驾护航。我们的使命:用算法的能力,让用户总能发现好东西,让美好生活触手可得。 1、深入理解抖音电商正向导购与逆向治理业务,基于大模型、多模态技术,优化商家/达人准入、发品、导购等全场景识别效果,同步探索语言、视频、推荐多模态融合方案,构建更强推荐系统; 2、迭代优化电商多模态大模型,强化其对治理规则、商品信息的理解与推理反思能力,通过业务域SFT、Cot、强化学习等技术,打造高准高召的识别能力,提升导购与治理审核智能化水平; 3、参与挖掘电商直播、短视频、图文等多类实体数据,对大规模网络及海量特征序列建模,支撑商家/商品分类、逆向标签挖掘等场景,助力精准识别潜在购物信号; 4、研究用户多模态交互(视频+直播+文字+行为)的复杂性,搭建统一框架实现内容理解与用户意图推理,高效映射内容消费到电商兴趣,提升人货匹配效率; 5、参与构建大规模图存储与图学习平台,完善商家、商品、达人、内容的关系链路,打造电商实体通用表征能力,赋能多模态业务落地; 6、协助推进电商比价、供给生态等战略支持工作,运用前沿深度学习算法,搭建商家/达人成长预测模型,支撑冷启动、潜爆、智能营销等业务需求。
工作职责 1. 利用LLM/VLM/ML/DM/DL/RL/图模型等技术解决小红书商业化风控场景中的实际问题 2.负责相关问题的分析、算法设计、模型研发以及推动上线,时刻follow与探索前沿技术
1、大模型理解方向:探索多模态大模型在视频、图像、文本内容的理解能力,构建场景化模型,提升风险识别准召率; 研究视频/图像拒绝理由的可解释性归因方法,推动人机协同审核应用落地; 构建大模型在风险防控、开户业务等场景的垂类内容理解能力,优化模型对抗性及迭代效率; 开发视频、图文向量化表征技术,提升跨模态检索能力(如视频索引、图文相似性检索); 2、大模型生成方向:研究多模态大模型(图像/视频)生成与修复技术,探索可控内容生成方法,提升风险素材过审率; 构建大模型训练、推理、评测的标准化流程,推动平台化能力建设与自动化迭代; 3、大模型推理部署方向:优化大模型推理框架(低延迟、高吞吐),研究量化、剪枝、动态调度等加速技术; 推动多模态大模型在工业级场景的轻量化部署落地。 *根据研究方向选择以上至少一个领域深入参与。