logo of kuaishou

快手多模态视频生成算法实习生-【可灵团队】

实习兼职D12753地点:北京状态:招聘

任职要求


1、熟悉视频生成基础模型如SVD、Sora、meta moviegen、hunyun video等;
2、熟悉多模态大语言模型(deepseek/qwen等)、多模态理解生成、世界模型优先;
3、熟悉语音驱动视频生成、语音生成优先;
4、有多模态大语言模型、图像/视频生成、3D生成大规…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与快手kling多模态视频生成的研发和落地工作(实习生以发论文为主),包括但不限于: t2v,i2v等基础模型研发、多模态可控视频生成编辑、世界模型等;
2、探索将多模态大语言模型mllm如deepseek/qwen相关技术与视频生成相结合,包括但不限于:提升kling视频生成的多模态理解、推理、多轮交互能力等;
3、探索将语音和视频生成相结合,包括但不限于:语音驱动的视频生成,有声视频等;
4、探索实时可拓展的多模态视频生成技术,提升多模态视频生成的质量和效率等;
5、在顶会顶刊上发表研究成果和开源代码,提升团队在多模态视频生成等领域的学术声望。
包括英文材料
大模型+
相关职位

logo of kuaishou
实习D12753

1、参与快手kling多模态视频生成的研发和落地工作(实习生以发论文为主),包括但不限于: t2v,i2v等基础模型研发、多模态可控视频生成编辑、世界模型等; 2、探索将多模态大语言模型mllm如deepseek/qwen相关技术与视频生成相结合,包括但不限于:提升kling视频生成的多模态理解、推理、多轮交互能力等; 3、探索将语音和视频生成相结合,包括但不限于:语音驱动的视频生成,有声视频等; 4、探索实时可拓展的多模态视频生成技术,提升多模态视频生成的质量和效率等; 5、在顶会顶刊上发表研究成果和开源代码,提升团队在多模态视频生成等领域的学术声望。

更新于 2025-12-02深圳
logo of kuaishou
实习D14604

1、数据效能研究(Data Efficiency):基于多模态大模型训练过程,分析不同模态数据的有效性、信息增益与贡献度;参与数据选择、数据蒸馏、难例挖掘等前沿技术探索,提升训练效率与模型表现; 2、数据–模型协同设计(Co-Design):与模型团队协作,从训练曲线、梯度信号与分布特征中反推数据质量,研究分阶段(预训练/SFT/对齐)数据策略,设计高效的数据结构与采样机制; 3、高质量数据构建(Data Quality Engineering):参与多模态数据 pipeline,包括自动标注、Caption 生成、数据去噪与一致性检查;探索弱监督、合成数据与模型 in-the-loop 的高质量数据生产方式; 4、多模态数据分析(Multimodal Analytics):对训练数据进行覆盖度、偏差与难度分析,构建可视化与指标体系,为模型能力诊断与数据重构提供依据。

更新于 2025-12-02北京
logo of kuaishou
实习D13338

1、主要负责可灵平台创作功能用户体验策略算法优化,帮助提升可灵平台用户留存、营收等核心指标; 2、参与大规模机器学习、深度学习领域技术研发工作,包括但不限于多模态、大模型SFT等算法研发; 3、参与搭建可灵平台在线学习策略算法系统,快速处理海量用户数据,提升算法性能,满足高并发、高时效性和可靠稳定性; 4、和产品、运营等团队合作,共同优化可灵社区生态,提供给用户更好体验,满足用户视频内容生产与消费、社交互动等多维需求。

更新于 2025-09-30北京
logo of kuaishou
实习D7965

1、负责短视频生产/直播/商业化等特效智能策略算法研发优化。提高用户对模板/魔表等特效使用基础体验,增强特效业务智能化; 2、紧跟AIGC算法原理和发展,利用公司内部快意/可图/可灵/TTS等大模型平台,结合业务需求进行AIGC应用落地; 3、负责特效大数据加工和分析,通过因果推断、运筹优化等方法对生产、消费数据挖掘,洞察业务痛点,指导及优化特效相关业务内容。

更新于 2025-07-15北京