logo of bytedance

字节跳动搜索算法工程师-AI搜索

社招全职A179175地点:北京状态:招聘

任职要求


1、出色的分析问题、解决问题能力,总是能从纷繁复杂的数据中一眼看出问题本质;
2、出色的机器学习(Deep Learning)、NLP数据挖掘基础,并能很好地建模应用于解决搜索问题;
3、优秀的代码能力、数据结构和基础算法功底;
4、熟悉Linux开发环境,熟练使用C++Python语言;
5、有主流大规模搜索引擎算法优化经验者加分。

工作职责


团队介绍:字节跳动抖音搜索团队主要负责抖音搜索算法创新和架构研发工作,主要包括短视频、直播、本地生活、视觉搜索等多个业务线。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。

1、参与字节跳动搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验;
2、参与抖音、今日头条等核心产品的搜索研发工作,服务海量用户;
3、参与搜索核心算法改进,可能的方向包括:
1)NLP:将业界最先进的NLP技术应用到搜索算法改进中,包括纠错、分词、改写、Term Weighting、意图识别;
2)Ranking:解决千亿级网页的排序问题,攻克基础检索、相关性、意图理解、权威性、时效性等世界难题;
3)页面分析和摘要:从千亿网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验;
4)链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等;
5)智能问答:探索最先进的阅读理解及语义抽取技术,研发开放域智能问答系统,直接在搜索结果第一位置满足用户Query需求。
包括英文材料
机器学习+
NLP+
数据挖掘+
数据结构+
算法+
Linux+
C+++
Python+
相关职位

logo of bytedance
社招A131227A

团队介绍:字节跳动抖音搜索团队主要负责抖音搜索算法创新和架构研发工作,主要包括短视频、直播、本地生活、视觉搜索等多个业务线。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 1、支持抖音AI搜/豆包等原生LLM应用的电商需求,负责大模型应用相关的数据建设、模型微调/对齐、RAG、规划Planning、Memory等工作; 2、支持大模型技术改进现有的电商搜索,探索大模型下的新搜索引擎设计,包括LLM适性的索引、基于LLM的相关性、生成式召回、排序大模型等; 3、探索AI找搭配/虚拟穿搭等AIGC创新应用。

更新于 2025-02-12
logo of meituan
社招1年以上核心本地商业-业

1. 主导大模型在搜索链路的全流程应用,包括Query理解、语义召回、结果排序等核心模块的算法优化 2. 研发搜索场景专用的大模型增强技术,涵盖意图识别、任务拆解、文本改写、多轮对话等关键技术方向 3. 探索Prompt Engineering、模型蒸馏、后训练、强化微调等前沿技术在搜索场景的落地实践 4. 构建面向AI搜索的数据挖掘体系,设计模型效果评估与迭代机制 5. 与工程团队协作推进算法模型的高效部署,与产品团队协同推进项目落地等

更新于 2025-04-22
logo of xiaohongshu
社招3-5年策略算法

1、负责搜索生成式问答相关技术研发,包括但不限于Query理解,召回,抽取,多模态内容理解,RAG,Agent等方向,探索LLM,除索LLM,Agent等大模型技术与搜索业务的结合; 2、参与小红书生成式搜索相关算法和系统研发,通过最新的生成式AI等技术,打造新一代智能化搜索引;

更新于 2025-10-10
logo of bytedance
社招A236182

团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索工程、算法创新和架构研发工作。我们的职责是用前沿的技术去打造一个用户体验佳、信息效率高的搜索引擎产品。我们的愿景是做一款用户首选的搜索引擎,我们的使命是可以充分整合内容,高效连接人与信息。 团队主要负责抖音、今日头条、西瓜视频、问答和百科等产品的业务研发和架构研发工作。 我们使用前沿的前端、客户端和服务端技术赋能于搜索业务的快速迭代,并在技术上不断创新和突破。同时专注于大流量、高并发、低延时的搜索系统的构建,在性能优化上,追求从内存、Disk等优化到业务架构和网络协议的创新探索,在迭代效能上不断探索容器化、动态化、搭建化等方案的创新,技术氛围强,充分给同学们提供自我成长的机会。 课题介绍:随着大模型技术的快速发展,智能搜索领域迎来了新的机遇和挑战。传统搜索技术在面对海量数据、多模态信息以及用户复杂需求时,逐渐暴露出模型容量不足、语义理解能力有限、资源利用率低等问题。基于大模型的智能搜索构建旨在通过引入大模型技术,提升搜索系统的智能化水平,优化用户体验,并解决超大规模检索、复杂语义理解、资源高效利用等核心问题。具体目标包括: 1、探索大模型与排序算法的结合,提升个性化排序的精度和用户体验; 2、研究生成式检索算法,解决百亿乃至千亿级别候选库的超大规模检索问题; 3、利用大语言模型(LLM)提升复杂多义Query的搜索满意度。 1、个性化排序:传统排序算法难以充分利用多模态信息(如文本、图像、视频等),且模型复杂度有限,无法满足用户对精准化和个性化搜索的需求; 2、超大规模检索:传统判别式模型在千亿级别候选库的检索中,面临模型容量不足、索引效率低下等问题,亟需新一代检索算法; 3、复杂Query理解:用户搜索需求日益复杂,传统搜索引擎难以准确理解长难句、多义Query的语义,导致搜索结果满意度低; 4、资源利用率:搜索系统存储和计算分离的架构导致资源利用率低,如何在保证性能的同时优化资源使用成为关键问题。

更新于 2025-05-26