logo of xiaohongshu

小红书【Ace顶尖实习生】基于MLLM的创作向深度思考能力提升

校招全职AIGC算法地点:北京 | 杭州 | 上海状态:招聘

任职要求


1、不限年级,本科及以上在读,计算机/人工智能/软件工程等相关专业优先;
2、优秀的代码能力、数据结构和基础算法功底,熟悉Python等至少一门编程语言;
3、熟悉大模型领域尤其是强化学习相关研究工作…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


目前主流的素材混剪能力主要依赖于素材的端内容理解、表征匹配、高光检测等能力帮助一键完成整个视频剪辑过程,偏模板化,且预定义较为死板,无法支持更丰富的信息量注入,以及用户自主输入剪辑要求。

本课题希望通过大语言模型的语义指令解析能力,开放基于可自定义prompt的视频编辑能力,通过指令分解、协同主题文案生成的方式,帮助完成带有故事感文案生成能力的视频剪辑功能。主要的技术难点包括:
1、多模态理解与表征:需要模型能够深入理解不同模态内容(视频片段、图像、音频)的语义和上下文;
2、时序理解与编辑:视频混剪需要理解时序信息,包括情节发展、节奏感、转场点等;
3、文案生成和改写:可自定义主题、风格的素材文案生成能力。
包括英文材料
数据结构+
算法+
Python+
大模型+
还有更多 •••
相关职位

logo of xiaohongshu
校招策略算法

在搜索等实际线上业务中,推理速度限定了线上可用的模型大小以及可达效果,当前的基于transformer架构的大模型基座在推理速度上存在系统性瓶颈。本课题探索基于创新框架,如diffusion LLM和linear attention model的大模型基座范式,从数据、模型预训练、后训练、AI Infra、评测等方向探索模型效果极限。

更新于 2026-03-24北京|上海|杭州
logo of xiaohongshu
校招大模型

在搜索等实际线上业务中,推理速度限定了线上可用的模型大小以及可达效果,当前的基于transformer架构的大模型基座在推理速度上存在系统性瓶颈。本课题探索基于创新框架,如diffusion LLM和linear attention model的大模型基座范式,从数据、模型预训练、后训练、AI Infra、评测等方向探索模型效果极限。

更新于 2026-04-05北京|上海|杭州
logo of xiaohongshu
校招大模型

我们致力于构建可持续进化的 Agent 系统:让 Agent 在真实环境中通过交互、学习与数据闭环,不断提升复杂任务能力。 围绕“数据 → 学习 → 自进化”三位一体展开: - Agent 自进化: 基于真实任务轨迹与反思机制,提升 Agent 在长期交互中的自主学习能力,解决反馈建模、策略泛化与错误累积问题。 - RL for Agent Systems: 将强化学习引入 Agent 全链路(规划-执行-反馈),研究 trajectory-level reward、credit assignment 及 offline/online 混合训练。 - Agentic Data Construction: 构建由 Agent 主导的数据生产与筛选机制,形成“生成 → 评估 → 反哺”的数据闭环,持续放大模型能力。

更新于 2026-04-07北京|上海|杭州
logo of xiaohongshu
校招大模型

探索一种自进化Agent系统,使Agent能够在真实环境中通过持续交互不断优化自身能力。不同于静态模型训练,该方向强调“生成—执行—评估—更新”的闭环过程。 关键问题包括:如何基于真实任务构建可靠的反馈信号,如何从稀疏成功案例中提取可泛化策略,以及如何避免自我强化中的分布偏移与错误积累。 平台提供多场景Agent执行环境与完整轨迹数据,使得自进化机制可以在真实任务中验证。该方向旨在推动Agent从“被动能力载体”向“主动学习系统”转变,是实现长期智能演进的重要路径。

更新于 2026-04-06北京|上海|杭州