快手多模态视频生成算法实习生-【可灵团队】

实习兼职D127532025-12-10地点：北京状态：招聘

扫码手机上打开

任职要求

1、熟悉视频生成基础模型如SVD、Sora、meta moviegen、hunyun video等；
2、熟悉多模态大语言模型（deepseek/qwen等）、多模态理解生成、世界模型优先；
3、熟悉语音驱动视频生成、语音生成优先；
4、有多模态大语言模型、图像/视频生成、3D生成大规…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、参与快手kling多模态视频生成的研发和落地工作（实习生以发论文为主），包括但不限于: t2v，i2v等基础模型研发、多模态可控视频生成编辑、世界模型等；
2、探索将多模态大语言模型mllm如deepseek/qwen相关技术与视频生成相结合，包括但不限于：提升kling视频生成的多模态理解、推理、多轮交互能力等；
3、探索将语音和视频生成相结合，包括但不限于：语音驱动的视频生成，有声视频等；
4、探索实时可拓展的多模态视频生成技术，提升多模态视频生成的质量和效率等；
5、在顶会顶刊上发表研究成果和开源代码，提升团队在多模态视频生成等领域的学术声望。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

相关职位

多模态视频生成算法实习生-【可灵团队】

实习D12753

1、参与快手kling多模态视频生成的研发和落地工作（实习生以发论文为主），包括但不限于: t2v，i2v等基础模型研发、多模态可控视频生成编辑、世界模型等； 2、探索将多模态大语言模型mllm如deepseek/qwen相关技术与视频生成相结合，包括但不限于：提升kling视频生成的多模态理解、推理、多轮交互能力等； 3、探索将语音和视频生成相结合，包括但不限于：语音驱动的视频生成，有声视频等； 4、探索实时可拓展的多模态视频生成技术，提升多模态视频生成的质量和效率等； 5、在顶会顶刊上发表研究成果和开源代码，提升团队在多模态视频生成等领域的学术声望。

更新于 2025-12-10深圳

多模态大模型算法实习生-【可灵AI-数据效能研究方向】

实习D14604

1、数据效能研究（Data Efficiency）：基于多模态大模型训练过程，分析不同模态数据的有效性、信息增益与贡献度；参与数据选择、数据蒸馏、难例挖掘等前沿技术探索，提升训练效率与模型表现； 2、数据–模型协同设计（Co-Design）：与模型团队协作，从训练曲线、梯度信号与分布特征中反推数据质量，研究分阶段（预训练/SFT/对齐）数据策略，设计高效的数据结构与采样机制； 3、高质量数据构建（Data Quality Engineering）：参与多模态数据 pipeline，包括自动标注、Caption 生成、数据去噪与一致性检查；探索弱监督、合成数据与模型 in-the-loop 的高质量数据生产方式； 4、多模态数据分析（Multimodal Analytics）：对训练数据进行覆盖度、偏差与难度分析，构建可视化与指标体系，为模型能力诊断与数据重构提供依据。

更新于 2025-12-10北京

（可灵）可灵平台策略应用算法实习生

实习D13338

1、主要负责可灵平台创作功能用户体验策略算法优化，帮助提升可灵平台用户留存、营收等核心指标； 2、参与大规模机器学习、深度学习领域技术研发工作，包括但不限于多模态、大模型SFT等算法研发； 3、参与搭建可灵平台在线学习策略算法系统，快速处理海量用户数据，提升算法性能，满足高并发、高时效性和可靠稳定性； 4、和产品、运营等团队合作，共同优化可灵社区生态，提供给用户更好体验，满足用户视频内容生产与消费、社交互动等多维需求。

更新于 2025-12-22北京

特效策略算法实习生

实习D7965

1、负责短视频生产/直播/商业化等特效智能策略算法研发优化。提高用户对模板/魔表等特效使用基础体验，增强特效业务智能化； 2、紧跟AIGC算法原理和发展，利用公司内部快意/可图/可灵/TTS等大模型平台，结合业务需求进行AIGC应用落地； 3、负责特效大数据加工和分析，通过因果推断、运筹优化等方法对生产、消费数据挖掘，洞察业务痛点，指导及优化特效相关业务内容。

更新于 2025-07-15北京