百度多模态图像算法实习生(J80658)
任职要求
-计算机视觉、机器学习、数学等相关专业本科及以上学历 -有计算机视觉相关项目经验,熟练掌握计算机视觉算法和模型 -良好的编程能力,熟练使用至少一种编程语言(如Python, Java等);熟悉至少一种深度学习框架(如TensorFlow, PyTorch等) -良好的团队合作和沟通能力,有较强的自我驱动能力 -在多模态内容理解、内容安全审核等方向有实际项目经验,或在计算机视觉领域相关会议发表论文者优先
工作职责
-参与计算机视觉相关技术研发 -包括但不限于图像分类、目标检测、视频内容理解等任务 -负责开发和优化算法,并确保其性能和效率达到预期目标 -与团队成员紧密合作,协同解决开发过程中的问题和技术挑战
-参与金融行业应用产品相关算法研发 -负责算法开发和效果优化,并确保其性能和效率达到预期目标 -参与金融多模态数据处理(结构化数据/文本/图像),开发文档智能解析(OCR)、金融报表分析等专项算法 -跟踪FinTech领域前沿技术,探索LLM+RAG、Agent等新技术在金融场景的落地 -与团队成员紧密合作,协同解决开发过程中遇到的问题和技术挑战
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 1、负责计算机视觉和深度学习基本算法的开发与性能提升,从事图像算法研发和落地的相关工作; 2、将计算机视觉和人工智能技术应用到字节跳动旗下各产品线,并解决业务实际问题; 3、深入研究和探索多模态算法、迭代、落地应用,包括但不限于图像/视频的生成创作、图表理解/生成、逻辑推理等领域; 4、提出和实现前沿的算法,保持算法在工业界和学术界的领先。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:智能创作团队是字节跳动创作场景业务中台,负责了抖音、剪映等产品的技术和业务研发,涵盖了计算机视觉、深度学习、高性能计算、图形学、特效引擎等技术领域,并以多种形式向公司内部各业务线提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案,同时通过火山引擎为企业客户提供服务。 1、负责计算机视觉和深度学习基本算法的开发与性能提升,从事图像算法研发和落地的相关工作; 2、将计算机视觉和人工智能技术应用到字节跳动旗下各产品线,并解决业务实际问题; 3、深入研究和探索多模态算法、迭代、落地应用,包括但不限于图像/视频的生成创作、图表理解/生成、逻辑推理等领域; 4、提出和实现前沿的算法,保持算法在工业界和学术界的领先。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:智能创作团队是字节跳动创作场景业务中台,负责了抖音、剪映等产品的技术和业务研发,涵盖了计算机视觉、深度学习、高性能计算、图形学、特效引擎等技术领域,并以多种形式向公司内部各业务线提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案,同时通过火山引擎为企业客户提供服务。 1、负责计算机视觉和深度学习基本算法的开发与性能提升,从事图像算法研发和落地的相关工作; 2、将计算机视觉和人工智能技术应用到字节跳动旗下各产品线,并解决业务实际问题; 3、深入研究和探索多模态算法、迭代、落地应用,包括但限于图像/视频的生成创作、图表理解/生成、逻辑推理等领域; 4、提出和实现前沿的算法,保持算法在工业界和学术界的领先。