logo of kuaishou

快手【快Star-X】多模态理解工程师-视觉生成

校招全职J1007地点:北京状态:招聘

任职要求


1、硕士及以上学历,有LLM和VLM大模型训练经验;有较强的代码动手开发能力,对多模态大模型基座能力提升有较高的热情;
2、良好的沟通协作能力,能够与团队紧密合作,共同推进项目进展。

加…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


深度优化多模态大模型的Caption、表征、改写能力,打造业界第一梯队的多模态大模型,在AIGC技术指标上超过GPT-4o、Gemini Pro等闭源模型,落地于快手各业务线。
包括英文材料
学历+
还有更多 •••
相关职位

logo of kuaishou
校招J1007

1、对图像、视频、文本等进行深入的语义理解,支持短视频、直播、风控、搜索、推荐、商业化等业务需求; 2、推进视觉相关基础技术研发,如大规模分类、检测、分割、序列识别、人脸、自监督学习、内容生成、模型压缩和优化等。

更新于 2025-07-26北京
logo of kuaishou
校招J1007

1、负责研发业界领先的多模态理解与生成统一架构,从事基础模型预训练、监督微调、架构优化等,重点探索感知(理解)与生成能力的协同演进与边界突破; 2、研究高效建模多模态数据(图像、文本、视频等)的新范式,提升模型的信息表征、理解与联合生成能力; 3、探索并研发更高效的视觉编码器,构建更强大的多模态模型基础; 4、发表高水平学术论文和开源项目,提升团队在学术界、工业界的技术影响力。

更新于 2025-06-26北京
logo of kuaishou
实习J1007

1、对图像、视频、文本等进行深入的语义理解,支持短视频、直播、风控、搜索、推荐、商业化等业务需求; 2、推进视觉相关基础技术研发,如大规模分类、检测、分割、序列识别、人脸、自监督学习、内容生成、模型压缩和优化等。

更新于 2025-05-14北京
logo of kuaishou
实习J1006

团队介绍:快手商业智能生成团队主要负责快手商业化AIGC & Agent和多模态生成式推荐,研发的AI视频、AI小说等已在广告场景大规模落地并带来规模化收入,制定中国通信标准化协会AI视频生产标准;研发的多模态理解和大模型推荐技术,为商业化大盘带来显著提升。团队在 CVPR、ICCV、ICML、ICLR、AAAI等Al顶会发表多篇研究成果。 1、负责AIGC视觉生成方向的算法探索和落地开发,包括但不限于视频生成、图像编辑、文生图等; 2、参与基础模型的框架设计、预训练以及面向实际应用优化等,重点解决低成本、高品质生成、多样性以及可控编辑等关键问题; 3、紧跟学术前沿,深入研究视觉生成模型设计和优化的创新方法,全面提升视觉生成模型的生成效果; 4、发表高水平学术论文,提升团队在学术界、工业界的技术影响力。

更新于 2026-03-25北京