logo of bytedance

字节跳动NLP算法实习生-搜索

实习兼职A230423A地点:北京状态:招聘

任职要求


1、2026届本科及以上学历在读,计算机、软件工程等相关专业优先;
2、出色的分析问题、解决问题能力,可以从从纷繁复杂的数据中看出问题的本质;
3、良好的机器学习(Deep Learning)、NLP数据挖掘基础,并能很好地建模应用于解决搜索问题;
4、优秀的代码能力、数据结构和基础算法功底;掌握C/C++Python语言优先;
5、有搜索引擎算法优化、推荐算法优化、NLP前沿领域探索经验者加分。

工作职责


ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。

1、参与ByteDance搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验;
2、参与今日头条/抖音/电商/国际化短视频/国际化电商等核心产品的搜索研发工作,服务相关产品数亿用户;
3、参与搜索核心算法改进,可选的方向包括:
1)探索前沿NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;
2)跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,使搜索在上述业务中拥有更强大的检索能力;
3)个性化搜索:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;
4)千亿级数据:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。
包括英文材料
学历+
机器学习+
NLP+
数据挖掘+
数据结构+
算法+
C+
C+++
Python+
相关职位

logo of bytedance
实习A247906

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 1、参与ByteDance搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验; 2、参与今日头条/抖音/电商/国际化短视频/国际化电商等核心产品的搜索研发工作,服务相关产品数亿用户; 3、参与搜索核心算法改进,可选的方向包括: 1)探索前沿NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2)跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,使搜索在上述业务中拥有更强大的检索能力; 3)个性化搜索:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4)千亿级数据:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。

更新于 2025-02-18
logo of xiaohongshu
实习内容理解

1、短文本理解方向。对海量Query进行自动化的改写、实体抽取等,使得搜索结果更精准; 2、长文本理解方向。对复杂的长文本笔记进行多模态理解、标签建设,为下游提供高质量特征; 3、跟踪业界最新研究成果,并应用到实际产品中;

更新于 2025-09-04
logo of xiaohongshu
实习内容理解

1、短文本理解方向。对海量Query进行自动化的改写、实体抽取等,使得搜索结果更精准; 2、长文本理解方向。对复杂的长文本笔记进行多模态理解、标签建设,为下游提供高质量特征; 3、跟踪业界最新研究成果,并应用到实际产品中;

更新于 2025-09-10
logo of netease
实习网易云音乐

我们是网易云音乐算法团队,专注于行业领先的搜索及推荐算法,通过技术赋能云音乐各项业务,提升用户体验,产生商业化价值。 我们正在寻找一位了解大模型 LLM 在搜索推荐场景的应用、熟悉生成式技术及 NLP 相关知识的人才加入团队,加入我们,你可以参与学术研究和业务实践两个方面的工作,深度涉足生成式搜推领域—— 1、学术研究方面,你将和团队一同探索生成式大模型在搜推场景的前沿技术,研究新的算法(如生成式检索、大模型推荐优化等),助力发表高质量研究论文; 2、在业务实践方面,你将利用生成式技术、NLP 技术解决搜推业务场景中的问题,设计并实现高效解决方案,对生成式模型进行调优、部署及搜推链路集成,并开展评估与优化工作; 3、此外,你将直接接触到生成式搜推相关的大模型落地场景,包括且不限于基于 LLM 的搜索意图解析、推荐内容生成、多轮交互式搜推、RAG 优化等,体验最真实的生成式搜推应用场景。

更新于 2025-09-04