logo of xiaohongshu

小红书【Ace顶尖实习生】基于博弈学习的审核Agent增强

实习兼职大模型地点:北京 | 上海 | 杭州状态:招聘

任职要求


1、不限年级,本科及以上在读,计算机/人工智能/软件工程等相关专业优先;
2、优秀的代码能力、数据结构和基础算法功底,熟悉Python等至少一门编程语言;
3、熟悉大模型领域尤其是强化学习相关研究工作和算法,有大模型强化学习的研发基础;
4、在ICML/CVPR/NeurIPS/ACL等顶级期刊会议上发表论文者优先;
5、良好的沟通协作能力,责任心强,积极主动,能和团队一起探索新技术,推进技术进步。

工作职责


传统审核大模型通常采用SFT的方式逼近人审对审核规则的识别精度,此时人工执行质量和规则合理性则成为机审体系性能上限。

本课题通过RLVR和Multi-Agent的方式,构造机审判别Agent与规则生成Agent的博弈学习,以对抗上升的方式不断提升审核规则的完备性以及相应机审识别的准召,使得机审可以突破人工上限,实现大模型智能在审核象限的涌现和“Aha moment”。
包括英文材料
数据结构+
算法+
Python+
大模型+
强化学习+
ICML+
CVPR+
NeurIPS+
相关职位

logo of xiaohongshu
实习策略算法

传统的AI搜索依然基于RAG框架,少有的几个Agent框架也只涉及QueryPlanning,距离真实解决搜索中的实际问题还相距很远,例如做旅游攻略、做行业研究报告等等。我们判断,虽然当下LLM已经大范围的用于搜索领域,但是下一代的搜索技术变革一定是基于Agent的。本课题旨在研究基于Agent框架的基座模型。

logo of xiaohongshu
实习AIGC算法

目前主流的素材混剪能力主要依赖于素材的端内容理解、表征匹配、高光检测等能力帮助一键完成整个视频剪辑过程,偏模板化,且预定义较为死板,无法支持更丰富的信息量注入,以及用户自主输入剪辑要求。 本课题希望通过大语言模型的语义指令解析能力,开放基于可自定义prompt的视频编辑能力,通过指令分解、协同主题文案生成的方式,帮助完成带有故事感文案生成能力的视频剪辑功能。主要的技术难点包括: 1、多模态理解与表征:需要模型能够深入理解不同模态内容(视频片段、图像、音频)的语义和上下文; 2、时序理解与编辑:视频混剪需要理解时序信息,包括情节发展、节奏感、转场点等; 3、文案生成和改写:可自定义主题、风格的素材文案生成能力。

logo of xiaohongshu
实习测试开发

随着人工智能技术的快速发展,大模型在代码生成、语义理解、逻辑推理等领域展现出巨大潜力。软件质量保障作为软件工程的核心环节,传统方法存在测试用例设计效率低、场景覆盖率不足、自动化脚本维护成本高等痛点。 本课题旨在联合高校科研力量与企业工程实践,探索大模型技术在测试用例生成、单元测试自动化、UI测试脚本生成等质量保障场景中的创新应用。

更新于 2025-08-30
logo of xiaohongshu
校招策略算法

在搜索等实际线上业务中,推理速度限定了线上可用的模型大小以及可达效果,当前的基于transformer架构的大模型基座在推理速度上存在系统性瓶颈。本课题探索基于创新框架,如diffusion LLM和linear attention model的大模型基座范式,从数据、模型预训练、后训练、AI Infra、评测等方向探索模型效果极限。

更新于 2025-07-25