logo of kuaishou

快手(可灵AI专项)多模态理解算法工程师

社招全职3-5年J0011地点:北京 | 深圳状态:招聘

任职要求


1、学历与经验:硕士及以上学历,3年及以上相关工作经验。计算机视觉自然语言处理或多模态方向背景优先;
2、学术背景:具备较强的学术调研能力,能快速理解和实现论文中的算法;有高质量论文发表、开源项目贡献、ACM竞赛或相关学术比赛获奖经历者优先;
3、深度学习能力:熟练掌握深度学习框架(如PyTorch、TensorFlow),有模型训练、压缩、蒸馏和…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、大规模视频理解:负责可灵海量视频数据的打标分类、语义分割、文字识别、Caption生成、聚类分析等工作;
2、模型开发与优化:基于CNN、VLM等技术推进模型训练、微调、评测及高效部署,推动模型在实际场景中的大规模应用;
3、技术研究与创新:聚焦多模态视频生成领域前沿课题,探索生成模型的数据采样技术,提升生成模型的数据使用效率和语义响应能力,打造在业界的领先技术优势;
4、跨领域协作:参与跨团队跨部门技术协同,推动Human in the loop在视频生成领域的研究落地。
包括英文材料
学历+
OpenCV+
NLP+
算法+
深度学习+
还有更多 •••
相关职位

logo of kuaishou
社招3-5年J0011

1、从事AIGC领域的算法探索和落地开发,负责项目规划与前沿技术推进;负责视觉生成基础模型的框架设计与预训练,以及面向实际应用的优化; 2、研发方向包括但不限于图像/视频/3D图形的生成,重点解决低成本、高品质生成以及可控编辑等关键问题。

更新于 2026-03-30北京
logo of kuaishou
社招3年以上D4124

1、大规模视频理解:负责可灵海量视频数据的打标分类、语义分割、文字识别、Caption生成、聚类分析等工作; 2、模型开发与优化:基于CNN、VLM等技术推进模型训练、微调、评测及高效部署,推动模型在实际场景中的大规模应用; 3、技术研究与创新:聚焦多模态视频生成领域前沿课题,探索生成模型的数据采样技术,提升生成模型的数据使用效率和语义响应能力,打造在业界的领先技术优势; 4、跨领域协作:参与跨团队跨部门技术协同,推动Human in the loop在视频生成领域的研究落地。

更新于 2025-07-15深圳
logo of kuaishou
社招3-5年J0011

1、研发行业领先且实用的AIGC视觉生成大模型技术,包括AIGC视觉生成大模型、文生图、图生图、保ID的可控编辑、图文/视频多模态理解及生成技术落地; 2、构建完整的AIGC视觉生成系统链路,推动在快手创作/消费/搜索/商业化/AI生产工具等场景的规模应用,实现AIGC关键技术突破、极致打磨效果体验,在各业务场景创作用户价值; 3、负责AIGC技术及产品效果创新,持续打造业界的技术口碑及影响力。

更新于 2026-03-30北京
logo of kuaishou
社招3-5年J0005

1、产品战略与规划: 深入洞察AIGC行业趋势、用户需求和竞争格局,负责AI图像生成模型及相关应用功能(Web & App)的中长期产品规划和迭代路线图; 2、核心功能与体验设计: 负责AI图像生成核心功能的完整生命周期,通过提升模型的可控性、表现力和易用性,系统性地优化用户创作体验,并探索与定义前沿的AI原生交互模式; 3、一体化工作流构建: 规划并推动图像与视频生成工作流的深度整合方案,打造连贯、高效的一体化创作体验,构建平台的核心竞争壁垒; 4、模型效果定义与驱动: 与算法团队紧密协作,将用户场景和产品需求,转化为清晰、可量化的模型效果评估标准。通过建立评测体系和反馈闭环,持续驱动算法模型在美学、可控性、真实感等方面的迭代精进; 5、数据驱动与用户洞察: 深度挖掘用户行为数据,结合定性/定量的用户研究和A/B测试,科学地评估产品表现,精准洞察用户核心意图与痛点,发现增长机会并驱动产品决策; 6、跨团队协同与项目管理: 作为项目核心,高效地与算法、工程、设计、运营、法务等团队沟通协作,确保产品高质量、按时交付,并达成预期的业务和数据目标。

更新于 2026-04-10北京