logo of kuaishou

快手多模态内容理解算法工程师/专家

社招全职5-10年J0011地点:北京状态:招聘

任职要求


1、硕士及以上学历,有大规模模型训练、压缩、蒸馏、微调等经验,熟悉megatrondeepspeed等框架者优先;
2、精通至少一种技术语言,包括但不限于JavaC/C++C#、Python等;
3、熟悉至少一种深度学习框架(如 Tens…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责快手短视频多模态内容理解工作,应用计算机视觉、NLP、多模态融合等技术,提升短视频内容体系建设、推荐、搜索的效果和体验;
2、基于多模态模型在下游业务上的应用,包括并不限于多模态分类、标签、caption等文本生成等;
3、负责计算机多模态理解方向前沿问题的研究,参与建设并持续保持部门在多模态业界的技术先进性,保持创新的同时将业界SOTA模型持续优化并落地至线上获得收益。
包括英文材料
学历+
Megatron+
DeepSpeed+
Java+
C+
C+++
还有更多 •••
相关职位

logo of amap
社招3年以上技术类-算法

负责图像、视频内容理解相关的大模型研发工作,包括但不限于视觉描述生成(Video Caption)、视觉问答(VQA)、多模态大模型(MLLM)等技术,通过内容理解相关算法在业务中的探索与应用,解决实际业务问题;

更新于 2025-09-23北京
logo of kuaishou
社招D13918

1、负责快手多媒体内容理解工作,应用计算机视觉、NLP、多模态融合等技术,提升短视频/直播内容体系建设、推荐、搜索的效果和体验; 2、负责快手多媒体相关的内容理解、语义理解的相关算法的研发,包括但不限于视频多分类、视频多标签、视频多模态embedding学习; 3、负责计算机多模态方向前沿问题的研究,参与建设并持续保持部门在多模态业界的技术先进性,保持创新的同时将业界SOTA模型持续优化并落地至线上获得收益。

更新于 2025-05-19北京
logo of kuaishou
社招5-10年J0011

1、参与电商多模态大模型(MLLMs)的持续预训练和指令微调(SFT),开发精准的商品图谱、用户意图理解、跨模态检索等核心能力,赋能搜索、推荐等业务; 2、负责多模态生成算法(如Diffusion Models, VAEs等)的研发与创新,致力于解决生成内容的质量、多样性、可控性、可编辑性及采样效率等前沿问题; 3、基于大模型构建文本/图像/视频多模态创作引擎,并推动其在电商业务场景的产品化落地,包括但不限于背景替换、虚拟试衣、图生视频、海报生成等创新应用; 4、通过DPO/PPO等强化学习算法,迭代Reward Model以指导多模态素材生成,引导模型生成更符合人类偏好、审美标准及业务目标的多模态内容,最终提升用户体验和商品转化率。

更新于 2025-09-30北京
logo of pinduoduo
社招1年以上技术类

1、负责NLP技术在商品内容理解算法和跨模态分析中的应用; 2、负责分析、挖掘电商场景中的多语种多类型文本数据,包括但不限于商品的标题、sku、描述、属性等,构建全面的商品属性体系; 3、负责内部NLP基础能力的建设和维护,包括但不限于实体识别、语义理解、多模态理解、文本生成等。

更新于 2026-04-10上海