logo of kuaishou

快手多模态内容理解算法工程师

校招全职J1007地点:北京状态:招聘

任职要求


1、硕士及以上学历,对视觉前沿技术有浓厚兴趣,时刻跟进学术界最新进展,有自己独立的想法和判断,能够快速复现学术界最新成果;
2、编程基础扎实,熟练掌握C++/Python,熟悉PytorchTensorFlow等训练框架;
3、对常见的模型结构、建模方法、Loss设计、优化策略、训练过程中的重要tricks等有深入了解和丰富经验;
4、工作认真努力,有很好的沟通能力。

工作职责


1、对图像、视频、文本等进行深入的语义理解,支持短视频、直播、搜索、推荐、商业化等业务需求;
2、推进视觉相关基础技术研发,如大规模分类、检测、分割、序列识别、人脸、自监督学习、内容生成、模型压缩和优化等。
包括英文材料
学历+
C+++
Python+
PyTorch+
TensorFlow+
相关职位

logo of kuaishou
社招5-10年D13918

1、负责快手短视频多模态内容理解工作,应用计算机视觉、NLP、多模态融合等技术,提升短视频内容体系建设、推荐、搜索的效果和体验; 2、基于多模态模型在下游业务上的应用,包括并不限于多模态分类、标签、caption等文本生成等; 3、负责计算机多模态理解方向前沿问题的研究,参与建设并持续保持部门在多模态业界的技术先进性,保持创新的同时将业界SOTA模型持续优化并落地至线上获得收益。

更新于 2025-08-21
logo of baidu
社招MEG

-负责推荐广告场景下文、图、视频多模态内容理解算法研发,从质量、风格、营销特色等维度建设内容理解标题体系 -负责多模态内容理解与推荐广告算法的结合,用于优化广告的体验、召回、排序、点击率转化率预估等环节的效果 -负责大语言模型及生成式AI等业界前沿技术的调研及并应用于内容理解,提升内容理解效果 -负责内容理解领域内新技术调研及创新应用范式的探索

更新于 2024-09-11
logo of amap
社招3年以上技术类-算法

负责图像、视频内容理解相关的大模型研发工作,包括但不限于视觉描述生成(Video Caption)、视觉问答(VQA)、多模态大模型(MLLM)等技术,通过内容理解相关算法在业务中的探索与应用,解决实际业务问题;

更新于 2025-09-23
logo of alibaba
社招

1、负责多模态 & 大模型在商品领域落地项目,涵盖商品内容理解&结构化/商品质量甄别/商品标题/图片生成/同款识别等任务。 2、负责商品检索相关的计算机视觉算法的创新和研究,包括但不限于:目标检测、图像分类、图像表征、图像校正与增强等相关算法研究。 3、负责商品知识库构建&知识标准化等工作。 4、负责跟踪业界前沿NLP&CV技术进展,寻找有价值的科研问题,开展前沿算法的研究工作,推进技术进步; 5、负责理解业务需求,进行针对性的研究算法,面向电商场景落地,发挥算法在实际应用中的价值。

更新于 2025-04-17