logo of baidu

百度多模态图像算法工程师(J80688)

社招全职MEG地点:北京状态:招聘

任职要求


-计算机视觉机器学习、数学等相关专业,本科及以上学历
-有计算机视觉相关项目经验,熟练掌握计算机视觉算法和模型
-良好的编程能力,熟练使用至少一种编程语言(如Python, Java等);熟悉至少一种深度学习框架(如TensorFlow, PyTorch等)
-良好的团队合作和沟通能力,有较强的自我驱动能力
-在多模态内容理解、内容安全审核等方向有实际项目经验,或在计算机视觉领域相关会议发表论文者优先

工作职责


-参与计算机视觉相关技术研发
-包括但不限于图像分类、目标检测、视频内容理解等任务
-负责开发和优化算法,并确保其性能和效率达到预期目标
-与团队成员紧密合作,协同解决开发过程中的问题和技术挑战
包括英文材料
OpenCV+
机器学习+
学历+
算法+
Python+
Java+
深度学习+
TensorFlow+
PyTorch+
相关职位

logo of vivo
社招3年以上研发类

作为核心算法成员,参与AI图像相关算法研发,主要服务于下一代智能相册系统。主要工作包括: 一、图像理解方向: 1)开发基于多模态语义的图像理解算法:人物识别、事件聚类、情绪识别、场景识别等;构建个性化的图像语义标签体系; 2)设计图像内容质量评估模型(重复、模糊、人脸表情等)提升用户体验; 3)探索RAG、多模态图像大模型、文本大模型联动下,agent能力建设和开发。 二、 图像AIGC方向(创作与编辑): 1)研究并实现图像生成与编辑算法,如背景替换、人像美化、风格迁移、文生图,图生图等; 2)参与基于 Diffusion基础模型训练; 3)参与ControlNet、Inpainting、aigc编辑大模型等前沿应用模型的业务开发和落地;

logo of kuaishou
社招D1071

1、负责快手短视频、直播等场景的风控治理算法研究及应用; 负责图像分类、目标检测、多模态算法的研发创新; 2、参与设计基于CV/多模态/NLP/图像算法的内容安全审核方案,应用到快手的视频、直播、图文等多个核心场景; 3、深入理解业务本质,与产品运营配合,持续提升风控效果,综合使用多种手段,识别平台内不良内容,解决内容风险的问题。

更新于 2025-06-11
logo of transsion
校招

1、负责手机视频/图像处理、计算摄影、计算机视觉、机器学习等算法的规划、设计和实现。 2、负责图像视频算法在项目上应用落地,包括人像美颜/增强/虚化/渲染、HDR/降噪/超分/去模糊,基于EVS/多光谱等新器件的定制化算法设计。主要职责包含原型验证,方案开发,性能/效果优化、对比分析等。 3、负责感知算法,例如场景识别、目标检测及跟踪,分割、深度估计,运动估计,视频理解等算法的性能/效果优化、模型训练,量化与部署等。 4、负责AIGC新业务方向算法,例如AIGC图像编辑,图像生成,多模态图像重绘,图-视频转换等算法的数据构建,原型开发,模型轻量化及端侧部署。 5、与影像camera其他软件开发,调试,硬件团队紧密合作,优化图像和视频质量,保证拍照效果。 6、持续学习和提升,关注最新学术论文和行业技术,对图像算法技术长期跟进和梳理。

更新于 2025-08-18
logo of transsion
校招

1、负责手机视频/图像处理、计算摄影、计算机视觉、机器学习等算法的规划、设计和实现。 2、负责图像视频算法在项目上应用落地,包括人像美颜/增强/虚化/渲染、HDR/降噪/超分/去模糊,基于EVS/多光谱等新器件的定制化算法设计。主要职责包含原型验证,方案开发,性能/效果优化、对比分析等。 3、负责感知算法,例如场景识别、目标检测及跟踪,分割、深度估计,运动估计,视频理解等算法的性能/效果优化、模型训练,量化与部署等。 4、负责AIGC新业务方向算法,例如AIGC图像编辑,图像生成,多模态图像重绘,图-视频转换等算法的数据构建,原型开发,模型轻量化及端侧部署。 5、与影像camera其他软件开发,调试,硬件团队紧密合作,优化图像和视频质量,保证拍照效果。 6、持续学习和提升,关注最新学术论文和行业技术,对图像算法技术长期跟进和梳理。

更新于 2025-08-18