网易算法实习生(搜索NLP大模型)
任职要求
1、2026年及之后毕业的全日制在校生,近期可入职,至少实习4个月,且对生成式 AI 与搜推技术的交叉领域有强烈探索欲,能快速跟进前沿技术并尝试应用于实际场景,具备创新思维; 2、掌握深度学习、自然语言处理(NLP)、信息检索等核心技术,需熟悉生成式大模型(LLM)在搜索推荐场景的落地逻辑; 3、具备良好的英文文献阅读能力,能准确理解前沿技术报告,可规范撰写生成式模型调优报告、搜推策略方案等技术文档; 4、具备优秀的团队协作意识和高效沟通能力,能深度参与生成式搜推项目的方案研讨、技术攻坚及成果复盘,推动项目高效落地; 5、具备扎实的编程能力,熟练运用 Python 语言,能熟练使用 PyTorch/TensorFlow 等框架完成生成式模型的微调、部署及搜推链路集成,有相关工具实操经验者优先; 6、有生成式搜推方向实践经历,例如参与过基于 LLM 的搜索意图解析、推荐内容生成、多轮交互式搜推等项目;有相关领域论文发表(如生成式检索、大模型推荐优化等方向)或竞赛获奖经历者优先。 若你符合上述要求,且渴望投身生成式搜推技术的实践与创新,欢迎投递,共同探索大模型在搜推领域的无限可能!
工作职责
我们是网易云音乐算法团队,专注于行业领先的搜索及推荐算法,通过技术赋能云音乐各项业务,提升用户体验,产生商业化价值。 我们正在寻找一位了解大模型 LLM 在搜索推荐场景的应用、熟悉生成式技术及 NLP 相关知识的人才加入团队,加入我们,你可以参与学术研究和业务实践两个方面的工作,深度涉足生成式搜推领域—— 1、学术研究方面,你将和团队一同探索生成式大模型在搜推场景的前沿技术,研究新的算法(如生成式检索、大模型推荐优化等),助力发表高质量研究论文; 2、在业务实践方面,你将利用生成式技术、NLP 技术解决搜推业务场景中的问题,设计并实现高效解决方案,对生成式模型进行调优、部署及搜推链路集成,并开展评估与优化工作; 3、此外,你将直接接触到生成式搜推相关的大模型落地场景,包括且不限于基于 LLM 的搜索意图解析、推荐内容生成、多轮交互式搜推、RAG 优化等,体验最真实的生成式搜推应用场景。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 1、电商搜索:深度参与字节跳动电商搜索技术工作,提升用户对搜索的使用效率,为搜索流量的持续增长贡献力量; 2、前沿技术:通过搜索NLP技术、大模型技术、推荐技术、多模态技术,为用户提供更加精准、智能的搜索服务; 3、海量数据:基于抖音等产品及电商业务的海量数据,对搜索推荐系统进行创新改进,挖掘数据价值,提升系统性能与用户体验。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 1、电商搜索:深度参与字节跳动电商搜索技术工作,提升用户对搜索的使用效率,为搜索流量的持续增长贡献力量; 2、前沿技术:通过搜索NLP技术、大模型技术、推荐技术、多模态技术,为用户提供更加精准、智能的搜索服务; 3、海量数据:基于抖音等产品及电商业务的海量数据,对搜索推荐系统进行创新改进,挖掘数据价值,提升系统性能与用户体验。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括: 1、探索最前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的个性化匹配问题,让搜索更加精准更加懂你; 4、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新; 5、千亿级数据规模的架构:设计和自研业内领先的检索架构,研发面向网页、视频、图文、电商等不同体裁的大规模数据处理平台,构建高吞吐、低延迟、高可用的搜索在线服务。 1、参与抖音,今日头条,西瓜视频,剪映等App,以及国内外电商,生活服务等业务的搜索推荐模型和策略改进,负责这些业务的搜索流量和用户渗透增长&搜索心智建设任务;接触公司前沿的推荐系统,搜索引擎和NLP技术,有广阔发展空间; 2、以推荐算法为核心技术栈,改进基于超大规模机器学习模型的推荐系统,覆盖从候选挖掘到召回,粗排,精排,多目标融合全链路技术环节; 3、探索短文本推荐和通用推荐技术的上限,重点是推荐和NLP技术的联合应用,以及大模型应用,多模态等前沿技术的探索。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 1、参与搜索引擎(策略、模型)研发工作,支持抖音/今日头条/电商/番茄小说/红果短剧等具有数亿用户的产品,致力于为数亿用户提供数千亿精准搜索结果,打造极致的搜索体验; 2、探索前沿技术,探索大模型等创新技术在AI搜索场景的落地,参与搜索引擎、搜索大模型的改进,包括而不限于: 1)NLP、大模型:构建大规模高质量数据(数据建设、数据抓取与解析、数据合成等)、分词、NER,文本、多模态预训练、Query分析、基础相关性等,全链路结合应用机器学习/深度学习模型,探索搜索引擎与大模型、LLM、MLLM、多模态、机器学习、强化学习等前沿技术的结合,实现搜索引擎全链路革新并进行极致的系统优化,探索提升AI搜索引擎的能力,包含而不限于相关性、权威性、时效性、意图理解能力等;探索新的自然语言处理算法、信息检索技术、LLM适性索引、LLM相关性、生成式召回、排序大模型等,提高搜索引擎的准确性和智能化程度; 2)召回与排序:借助语义理解、个性化预估、机制设计等技术,解决超大规模的视频、商品、直播、POI等搜索业务下的召回、排序、重混排模型; 3)多模态、跨模态匹配技术:基于海量网页图文、抖音视频数据的大规模多模态预训练和视频分析技术,提升视觉搜索的使用体验;在搜索中结合CV+NLP深度学习技术,实现多模态、视频搜索、强大的语义理解和检索能力; 4)页面分析和摘要:从千亿视频/网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验; 5)链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等。