字节跳动多模态算法实习生-智能创作
任职要求
1、2026届硕士及以上学位在读,计算机、软件工程等相关专业优先; 2、扎实的数学和算法基础:识别、检索、多模态预训练、概率统计、数值优化等相关算法; 3、具有文本理解、文本缩略、文本改写、机器学习、图像分类和识别、图像视频理解、图像分割、目标检测、OCR、视觉创作、3D、多模态、计算机视觉、NLP、生成、AIGC等一个或多个方向研究与落地经验者优先; 4、较强的问题分析与学习能力,能快速跟进前沿技术,并应用于实际问题解决;有扎实的编程基础,熟悉C++/Python等编程语言,具有快速复现前沿论文的能力; 5、熟悉Caffe、Tensorflow、Mxnet、Pytorch、Keras等框架中的一种或以上; 6、良好的自驱意识及执行力,实践动手能力强,ACM、ICPC、NOI/IOI、Top Coder、Kaggle比赛获奖者优先;作为主要作者发表过顶级论文者优先,CVPR/ICCV/ECCV/IEEE/ACL/EMNLP/NAACL/NIPS/ICML等。
工作职责
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 1、负责计算机视觉和深度学习基本算法的开发与性能提升,从事图像算法研发和落地的相关工作; 2、将计算机视觉和人工智能技术应用到字节跳动旗下各产品线,并解决业务实际问题; 3、深入研究和探索多模态算法、迭代、落地应用,包括但不限于图像/视频的生成创作、图表理解/生成、逻辑推理等领域; 4、提出和实现前沿的算法,保持算法在工业界和学术界的领先。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:智能创作团队是字节跳动创作场景业务中台,负责了抖音、剪映等产品的技术和业务研发,涵盖了计算机视觉、深度学习、高性能计算、图形学、特效引擎等技术领域,并以多种形式向公司内部各业务线提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案,同时通过火山引擎为企业客户提供服务。 1、负责计算机视觉和深度学习基本算法的开发与性能提升,从事图像算法研发和落地的相关工作; 2、将计算机视觉和人工智能技术应用到字节跳动旗下各产品线,并解决业务实际问题; 3、深入研究和探索多模态算法、迭代、落地应用,包括但不限于图像/视频的生成创作、图表理解/生成、逻辑推理等领域; 4、提出和实现前沿的算法,保持算法在工业界和学术界的领先。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:智能创作团队是字节跳动创作场景业务中台,负责了抖音、剪映等产品的技术和业务研发,涵盖了计算机视觉、深度学习、高性能计算、图形学、特效引擎等技术领域,并以多种形式向公司内部各业务线提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案,同时通过火山引擎为企业客户提供服务。 1、负责计算机视觉和深度学习基本算法的开发与性能提升,从事图像算法研发和落地的相关工作; 2、将计算机视觉和人工智能技术应用到字节跳动旗下各产品线,并解决业务实际问题; 3、深入研究和探索多模态算法、迭代、落地应用,包括但限于图像/视频的生成创作、图表理解/生成、逻辑推理等领域; 4、提出和实现前沿的算法,保持算法在工业界和学术界的领先。
1、负责计算机视觉&多模态&3DGS相关算法研发,面向但不限于:3DGS、3D重建、多模态检索、embedding、多模态目标检测、分割、Metric Learning、主体识别、质量评价等等;时刻follow与探索前沿技术;(以上方向擅长一个即可) 2、负责相关算法和系统的持续迭代和进化;同时能够深入小红书丰富的业务场景,结合实际需求进行技术落地和创新;