logo of kuaishou

快手(可灵AI专项)多模态理解算法工程师

社招全职3-5年D4124地点:北京状态:招聘

任职要求


1、学历与经验:硕士及以上学历,3年及以上相关工作经验。计算机视觉自然语言处理或多模态方向背景优先;
2、学术背景:具备较强的学术调研能力,能快速理解和实现论文中的算法;有高质量论文发表、开源项目贡献、ACM竞赛或相关学术比赛获奖经历者优先;
3、深度学习能力:熟练掌握深度学习框架(如PyTorchTensorFlow),有模型训练、压缩、蒸馏和微调经验;熟悉DeepSpeed等加速工具优先;
4、工程能力:具备优秀的独立开发与调试能力,熟悉Python服务开发,Hive大数据处理等技术;
5、团队协作:具备良好的沟通能力,乐于学习与分享,能够与团队高效协作解决问题。
【加分项】
1、熟悉视频处理相关工具与技术,如FFmpeg、OpenCV等;
2、在视频理解、多模态建模方向有实战项目经验。

工作职责


1、大规模视频理解:负责可灵海量视频数据的打标分类、语义分割、文字识别、Caption生成、聚类分析等工作;
2、模型开发与优化:基于CNN、VLM等技术推进模型训练、微调、评测及高效部署,推动模型在实际场景中的大规模应用;
3、技术研究与创新:聚焦多模态视频生成领域前沿课题,探索生成模型的数据采样技术,提升生成模型的数据使用效率和语义响应能力,打造在业界的领先技术优势;
4、跨领域协作:参与跨团队跨部门技术协同,推动Human in the loop在视频生成领域的研究落地。
包括英文材料
学历+
OpenCV+
NLP+
算法+
深度学习+
PyTorch+
TensorFlow+
DeepSpeed+
Python+
Hive+
相关职位

logo of kuaishou
社招3年以上D4124

1、大规模视频理解:负责可灵海量视频数据的打标分类、语义分割、文字识别、Caption生成、聚类分析等工作; 2、模型开发与优化:基于CNN、VLM等技术推进模型训练、微调、评测及高效部署,推动模型在实际场景中的大规模应用; 3、技术研究与创新:聚焦多模态视频生成领域前沿课题,探索生成模型的数据采样技术,提升生成模型的数据使用效率和语义响应能力,打造在业界的领先技术优势; 4、跨领域协作:参与跨团队跨部门技术协同,推动Human in the loop在视频生成领域的研究落地。

更新于 2025-07-15
logo of kuaishou
社招D7115

1、研发行业领先且实用的AIGC视觉生成大模型技术,包括AIGC视觉生成大模型、文生图、图生图、保ID的可控编辑、图文/视频多模态理解及生成技术落地; 2、构建完整的AIGC视觉生成系统链路,推动在快手创作/消费/搜索/商业化/AI生产工具等场景的规模应用,实现AIGC关键技术突破、极致打磨效果体验,在各业务场景创作用户价值; 3、负责AIGC技术及产品效果创新,持续打造业界的技术口碑及影响力。

更新于 2025-07-15
logo of kuaishou
社招3-5年D2863

1、对接视频/图片/音频等各类多模态模型的数据生产需求,打造业界领先的多模态数据生产引擎,持续提升训练数据的规模、质量和迭代效率,支撑可灵全系多模态生成模型训练; 2、搭建 Data Centric 的多模态数据处理 pipeline,包括数据处理算子开发、跨模态检索引擎开发、多模态数据的内容理解、质量筛选、组织与合成等关键环节; 3、构建高可用、高吞吐的数据算法服务框架,支持多模态模型服务的快速部署,持续优化多模态数据的存储以及检索效率。

更新于 2025-09-18
logo of kuaishou
社招3-5年D4131

1、从事AIGC领域的算法探索和落地开发,负责项目规划与前沿技术推进;负责视觉生成基础模型的框架设计与预训练,以及面向实际应用的优化; 2、研发方向包括但不限于图像/视频/3D图形的生成,重点解决低成本、高品质生成以及可控编辑等关键问题。

更新于 2025-08-29