logo of xiaohongshu

小红书内容安全算法实习(上海)

实习兼职风控算法地点:上海状态:招聘

任职要求


1.计算机、数学、电子工程或相关专业背景,硕士研究生或以上学历
2.具备优秀的编程能力,扎实的数据结构算法能力
3.熟悉深度学习算法机器学习算法,如Transformer/CLIP等
4.精通常用的深度学习框架,如TensorFlow/PyTorch等
5.做事认真负责,有良好的沟通协调能力和自驱力,能够承受一定的工作压力

补充说明:
1.安全风控平台部主要负责公司内容安全、业务风控、信息安全的平台建设和风险管理工作。通过AI算法大数据、情报攻防和终端安全灯多领域交叉技术建设安全风控平台,为数亿小红书用户提供安全健康的社区环境,同时保障电商、直播等业务的健康发展
2.平台稳定、场景丰富,欢迎有兴趣的同学加入
3.实习开始时间期望六月初,至少6个月,base上海

工作职责


1.负责评论维度方向模型的训练和基础系统性能的优化
2.利用自然语言,多模态等技术,从海量内容中识别风险用户与内容
3.跟踪行业最新动态,推进新算法的落地与应用
包括英文材料
学历+
数据结构+
算法+
深度学习+
机器学习+
Transformer+
TensorFlow+
PyTorch+
大数据+
相关职位

logo of bytedance
实习A90088

团队介绍:国际化内容安全算法研究团队致力于为字节跳动国际化产品的用户维护安全可信赖环境,通过开发、迭代机器学习模型和信息系统以更早、更快发掘风险、监控风险、响应紧急事件,团队同时负责产品基座大模型的研发,我们在研发过程中需要解决数据合规、模型推理能力、多语种性能优化等方面的问题,从而为平台上的内容审核、搜索、推荐等多项业务提供安全合规,性能优越的基座模型。 课题介绍: 背景:近年来,大规模语言模型(Large Language Models, LLM)在自然语言处理和人工智能的各个领域都取得了显著的进展。这些模型展示了强大的能力,例如在生成语言、回答问题、翻译文本等任务上表现优异。然而,LLM 的推理能力仍有很大的提升空间。在现有的研究中,通常依赖于大量的监督微调(Supervised Fine-Tuning, SFT)数据来增强模型的推理性能。然而,高质量 SFT 数据的获取成本高昂,这对模型的开发和应用带来了极大的限制。为了提升推理能力,OpenAI 的 o1 系列模型通过增加思维链(Chain-of-Thought, CoT)的推理过程长度取得了一定的成功。这种方法虽然有效,但在实际测试时如何高效地进行扩展仍是一个开放的问题。一些研究尝试使用基于过程的奖励模型(Process-based Reward Model, PRM)、强化学习(Reinforcement Learning, RL)以及蒙特卡洛树搜索算法(Monte Carlo Tree Search, MCTS)等方法来解决推理问题,然而这些方法尚未能达到 OpenAI o1 系列模型的通用推理性能水平。最近deepseek r1在论文中提到通过纯强化学习的方法,可以使得 LLM 自主发展推理能力,而无需依赖昂贵的 SFT 数据。这一系列的工作都揭示着强化学习对LLM的巨大潜力。 1、Reward模型的设计:在强化学习过程中,设计一个合适的reward模型是关键。Reward模型需要准确地反映推理过程的效果,并引导模型逐步提升其推理能力。这不仅要求对不同任务精准设定评估标准,还要确保reward模型能够在训练过程中动态调整,以适应模型性能的变化和提高; 2、稳定的训练过程:在缺乏高质量SFT数据的情况下,如何确保强化学习过程中的稳定训练是一个重大挑战。强化学习过程通常涉及大量的探索和试错,这可能导致训练不稳定甚至模型性能下降。需要开发具有鲁棒性的训练方法,以保证模型在训练过程中的稳定性和效果; 3、如何从数学和代码任务上拓展到自然语言任务上:现有的推理强化方法主要应用在数学和代码这些CoT数据量相对丰富的任务上。然而,自然语言任务的开放性和复杂性更高,如何将成功的RL策略从这些相对简单的任务拓展到自然语言处理任务上,要求对数据处理和RL方法进行深入的研究和创新,以实现跨任务的通用推理能力; 4、推理效率的提升:在保证推理性能的前提下,提升推理效率也是一个重要挑战。推理过程的效率直接影响到模型在实际应用中的可用性和经济性。可以考虑利用知识蒸馏技术,将复杂模型的知识传递给较小的模型,以减少计算资源消耗。另外,使用长思维链(Long Chain-of-Thought, Long-CoT)技术来改进短思维链(Short-CoT)模型,也是一种潜在的方法,以在保证推理质量的同时提升推理速度。

更新于 2025-03-05
logo of bytedance
实习A248261

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、支持抖音、直播、今日头条等业务线各个方向对于在视频、图像、文本多模态体裁的内容理解相关业务需求; 2、支持推荐算法、社区治理、安全审核算法等其他算法团队的内容理解能力,包括但不限于视频分类、表征学习、文本模型等技术; 3、从事多模态内容理解算法的前沿技术探索与研发,发表学术论文和申请专利。

更新于 2025-02-17
logo of bilibili
实习技术类

1.深入开展内容安全治理多模态大模型的调研工作,跟踪前沿技术发展趋势,分析不同模型在该场景下的适用性。 2.协助团队进行多模态大模型的训练工作,包括数据预处理、模型搭建、参数调整等,以提升模型在内容审核任务上的准确性和效率。 3.参与模型性能评估,分析实验结果,提出改进方案,优化模型性能。 4.与其他团队成员协作,共同解决在多模态模型应用于内容审核业务过程中遇到的技术问题。

更新于 2025-06-09
logo of xiaohongshu
实习风控算法

支持公司内容安全、业务风控、信息安全的平台建设和风险管理工作。通过AI算法、大数据、情报攻防和终端安全灯多领域交叉技术建设安全风控平台,为数亿小红书用户提供安全健康的社区环境,同时保障电商、直播等业务的健康发展 1.负责用户维度方向模型的训练和基础系统性能的优化 2.利用计算机视觉,自然语言,多模态等技术,从海量内容中识别风险用户与内容 3.跟踪行业最新动态,推进新算法的落地与应用

更新于 2025-09-30