快手多模态内容理解算法工程师
校招全职J1007地点:北京状态:招聘
任职要求
1、硕士及以上学历,对视觉前沿技术有浓厚兴趣,时刻跟进学术界最新进展,有自己独立的想法和判断,能够快速复现学术界最新成果; 2、编程基础扎实,熟练掌握C++/Python,熟悉Pytor…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、对图像、视频、文本等进行深入的语义理解,支持短视频、直播、搜索、推荐、商业化等业务需求; 2、推进视觉相关基础技术研发,如大规模分类、检测、分割、序列识别、人脸、自监督学习、内容生成、模型压缩和优化等。
包括英文材料
学历+
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
还有更多 •••
相关职位
社招5-10年D13918
1、负责快手短视频多模态内容理解工作,应用计算机视觉、NLP、多模态融合等技术,提升短视频内容体系建设、推荐、搜索的效果和体验; 2、基于多模态模型在下游业务上的应用,包括并不限于多模态分类、标签、caption等文本生成等; 3、负责计算机多模态理解方向前沿问题的研究,参与建设并持续保持部门在多模态业界的技术先进性,保持创新的同时将业界SOTA模型持续优化并落地至线上获得收益。
更新于 2025-08-21北京
社招MEG
-负责推荐广告场景下文、图、视频多模态内容理解算法研发,从质量、风格、营销特色等维度建设内容理解标题体系 -负责多模态内容理解与推荐广告算法的结合,用于优化广告的体验、召回、排序、点击率转化率预估等环节的效果 -负责大语言模型及生成式AI等业界前沿技术的调研及并应用于内容理解,提升内容理解效果 -负责内容理解领域内新技术调研及创新应用范式的探索
更新于 2024-09-11北京
社招3年以上技术类-算法
负责图像、视频内容理解相关的大模型研发工作,包括但不限于视觉描述生成(Video Caption)、视觉问答(VQA)、多模态大模型(MLLM)等技术,通过内容理解相关算法在业务中的探索与应用,解决实际业务问题;
更新于 2025-09-23北京