logo of bytedance

字节跳动计算机视觉算法实习生-搜索

实习兼职A141914A地点:北京状态:招聘

任职要求


1、2026届本科及以上学历在读,计算机、软件工程等相关专业优先;
2、出色的分析问题、解决问题能力,可以从从纷繁复杂的数据中看出问题的本质;
3、良好的机器学习(Deep Learning)、NLP数据挖掘基础,并能很好地建模应用于解决搜索问题;
4、优秀的代码能力、数据结构和基础算法功底;掌握C/C++Python语言优先;
5、有搜索引擎算法优化、推荐算法优化、NLP前沿领域探索经验者加分。

工作职责


ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。

1、参与计算机视觉和多模态领域的前沿技术研究,在产品中落地;
2、从事视频搜索、视觉搜索等相关算法的研究与开发工作,包括视频内容理解、视觉表征学习、多模态融合等;
3、通过多模态技术提升抖音、西瓜视频等产品的搜索体验。
包括英文材料
学历+
机器学习+
NLP+
数据挖掘+
数据结构+
算法+
C+
C+++
Python+
相关职位

logo of bytedance
实习A244001

ByteIntern:面向2025届毕业生(2024年9月-2025年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 1 、负责电商场景下计算机视觉相关模型的优化与迭代,包括商品图像细粒度分类、商品物体识别、商品主体识别、特征抽取、logo检测、品牌识别等,优化商家商品上下架流程; 2、负责电商短视频和直播的视频分类、多模态内容挖掘、多模态内容理解,优化电商短视频购物体验; 3、负责电商场景图像搜索、拍照搜商品、商品消重等算法优化迭代; 4、探索计算机视觉前沿技术,负责整体算法和系统的迭代和进化。

更新于 2024-04-21
logo of bytedance
实习A27997

ByteIntern:面向2025届毕业生(2024年9月-2025年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 1 、负责电商场景下计算机视觉相关模型的优化与迭代,包括商品图像细粒度分类、商品物体识别、商品主体识别、特征抽取、logo检测、品牌识别等,优化商家商品上下架流程; 2、负责电商短视频和直播的视频分类、多模态内容挖掘、多模态内容理解,优化电商短视频购物体验; 3、负责电商场景图像搜索、拍照搜商品、商品消重等算法优化迭代; 4、探索计算机视觉前沿技术,负责整体算法和系统的迭代和进化。

更新于 2024-04-21
logo of kuaishou
实习D13918

1、跟进计算机视觉及多模态等前沿技术方向,能够实现前沿算法,保持算法在工业界和学术界的领先; 2、探索计算机视觉及多模态算法在内容理解和内容生成等领域的应用,参与和推动技术落地到快手各产品线,如搜索、推荐、电商、商业化等; 3、打造算法技术在工业界和学术界的影响力,参与相关专利、顶会论文的发表。

更新于 2025-07-16
logo of bytedance
实习A147566A

团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索工程、算法创新和架构研发工作。我们的职责是用前沿的技术去打造一个用户体验佳、信息效率高的搜索引擎产品。我们的愿景是做一款用户首选的搜索引擎,我们的使命是可以充分整合内容,高效连接人与信息。 团队主要负责抖音、今日头条、西瓜视频、问答和百科等产品的业务研发和架构研发工作。 我们使用前沿的前端、客户端和服务端技术赋能于搜索业务的快速迭代,并在技术上不断创新和突破。同时专注于大流量、高并发、低延时的搜索系统的构建,在性能优化上,追求从内存、Disk等优化到业务架构和网络协议的创新探索,在迭代效能上不断探索容器化、动态化、搭建化等方案的创新,技术氛围强,充分给同学们提供自我成长的机会。 1、参与ByteDance搜索引擎研发工作,用前沿的机器学习深度学习算法、海量的数据,做激动人心的技术、给用户更好的搜索体验; 2、参与抖音/电商/生活服务等核心产品的搜索研发工作,致力于为数亿用户提供数千亿精准搜索结果,打造极致的搜索体验; 3、参与搜索核心算法改进,可选的方向包括: (1)NLP:利用LLM等技术,研发新的自然语言处理算法和信息检索技术,提高搜索引擎的准确性和智能化程度。 (2)召回与排序:借助语义理解、个性化预估、机制设计等技术,解决超大规模的视频、商品、直播、POI等搜索业务下的召回、排序、重混排模型; (3)多模态:基于海量网页图文、抖音视频数据的大规模多模态预训练和视频分析技术,提升视觉搜索的使用体验; (4)页面分析和摘要:从千亿视频/网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验; (5)链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等。 课题介绍:随着大模型技术的快速发展,智能搜索领域迎来了新的机遇和挑战。传统搜索技术在面对海量数据、多模态信息以及用户复杂需求时,逐渐暴露出模型容量不足、语义理解能力有限、资源利用率低等问题。基于大模型的智能搜索构建旨在通过引入大模型技术,提升搜索系统的智能化水平,优化用户体验,并解决超大规模检索、复杂语义理解、资源高效利用等核心问题。具体目标包括: 1、探索大模型与排序算法的结合,提升个性化排序的精度和用户体验; 2、研究生成式检索算法,解决百亿乃至千亿级别候选库的超大规模检索问题; 3、利用大语言模型(LLM)提升复杂多义Query的搜索满意度; 4、构建高性能、低资源消耗的大规模批流一体检索和计算系统,提升资源利用率。 1、个性化排序:传统排序算法难以充分利用多模态信息(如文本、图像、视频等),且模型复杂度有限,无法满足用户对精准化和个性化搜索的需求; 2、超大规模检索:传统判别式模型在千亿级别候选库的检索中,面临模型容量不足、索引效率低下等问题,亟需新一代检索算法; 3、复杂Query理解:用户搜索需求日益复杂,传统搜索引擎难以准确理解长难句、多义Query的语义,导致搜索结果满意度低; 4、资源利用率:搜索系统存储和计算分离的架构导致资源利用率低,如何在保证性能的同时优化资源使用成为关键问题。

更新于 2025-04-21