logo of bytedance

字节跳动搜索算法工程师-国际化生活服务搜索

社招全职A210624地点:北京状态:招聘

任职要求


1、出色的分析问题、解决问题的能力;
2、出色的机器学习深度学习基础能力,在NLP、个性化等领域有经验;
3、优秀的编码能力,有扎实的数据结…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、支持国际化视频生活服务业务,提升用户生服种草,酒旅、餐饮、休闲娱乐等生活服务领域的搜索体验,促进生态良性发展;
2、结合亿级用户搜索和推荐场景,应用机器学习技术提升用户购物体验和转化效率;
3、负责生活服务搜索算法设计与技术实现,搜索全栈(Query分析、相关性、召回、粗排、精排、混排)的个性化行为建模,包括相关性计算、CTR预估、CVR预估、向量召回、价值混排等。
包括英文材料
机器学习+
深度学习+
NLP+
数据结构+
还有更多 •••
相关职位

logo of bytedance
社招A08796

1、负责国际化短视频生活服务推荐算法,共同搭建业界领先的推荐系统; 2、深刻理解短视频/直播/地理位置/商品等推荐相关的机器学习/深度学习算法,优化模型/策略,持续提升推荐效果; 3、深入理解生活服务业务,从到店、外卖、酒旅等业务特性中挖掘算法亮点; 4、深入理解用户行为,结合数据挖掘等技术,优化用户创作和浏览等体验。

更新于 2023-11-13上海
logo of bytedance
社招A137488

团队介绍:国际化短视频搜索团队主要负责国际化短视频的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括: 1、探索最前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 主要负责: 1、参与国际化短视频,以及国际化短电商,生活服务等重点业务的搜索推荐模型和策略改进,负责这些业务的搜索流量和用户渗透增长 & 搜索心智建设任务; 2、以推荐算法为核心技术栈,改进基于超大规模机器学习模型的推荐系统,覆盖从候选挖掘到召回,粗排,精排,多目标融合全链路技术环节; 3、探索短文本推荐和通用推荐技术的上限,重点是推荐和NLP技术的联合应用,以及多模态等前沿技术的探索。 业务介绍 1、搜索增长业务:团队负责的功能和场景,基本覆盖了绝大多数的搜索流量并且是过去TikTok搜索流量增长的最大原因。手段包含引导/激发/便捷化搜索发生之前的全流程,如主feed里视频/评论激发的推荐query场景,搜索前的输入补全和搜索后的结果相关搜索场景。 不仅为搜索带来更多流量,也使得流量本身的单位价值更高; 2、电商搜索增长业务:电商是app重要的变现手段,搜索作为其中货架心智建设的关键一环,电商搜索流量的增长和心智的建立,在其中起到重要作用; 3、搜索与端的结合:作为搜索业务,同样负责fyp排序里搜索相关的排序逻辑,改变端的生态激发用户搜索探索更多内容的意愿。并且用用户的搜索行为,为用户提供更好的feed浏览体验。

更新于 2023-08-14北京
logo of bytedance
社招A91506

1、负责国际化短视频生活服务推荐算法,共同搭建业界领先的推荐系统; 2、深刻理解短视频/直播/地理位置/商品等推荐相关的机器学习/深度学习算法,优化模型/策略,持续提升推荐效果; 3、深入理解生活服务业务,从到店、外卖、酒旅等业务特性中挖掘算法亮点; 4、深入理解用户行为,结合数据挖掘等技术,优化用户创作和浏览等体验。

更新于 2023-12-15北京
logo of bytedance
社招A219775

团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新;5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 课题介绍:随着大模型技术的快速发展,智能搜索领域迎来了新的机遇和挑战。传统搜索技术在面对海量数据、多模态信息以及用户复杂需求时,逐渐暴露出模型容量不足、语义理解能力有限、资源利用率低等问题。基于大模型的智能搜索构建旨在通过引入大模型技术,提升搜索系统的智能化水平,优化用户体验,并解决超大规模检索、复杂语义理解、资源高效利用等核心问题。具体目标包括: 1、探索大模型与排序算法的结合,提升个性化排序的精度和用户体验; 2、研究生成式检索算法,解决百亿乃至千亿级别候选库的超大规模检索问题; 3、利用大语言模型(LLM)提升复杂多义Query的搜索满意度。 1、参与搜索引擎(策略、模型)研发工作,支持抖音/今日头条/电商/番茄小说/红果短剧等具有数亿用户的产品,致力于为数亿用户提供数千亿精准搜索结果,打造极致的搜索体验; 2、探索前沿技术,探索大模型等创新技术在AI搜索场景的落地,参与搜索引擎、搜索大模型的改进,包括而不限于: 1)NLP、大模型:构建大规模高质量数据(数据建设、数据抓取与解析、数据合成等)、分词、NER,文本、多模态预训练、Query分析、基础相关性等,全链路结合应用机器学习/深度学习模型,探索搜索引擎与大模型、LLM、MLLM、多模态、机器学习、强化学习等前沿技术的结合,实现搜索引擎全链路革新并进行极致的系统优化,探索提升AI搜索引擎的能力,包含而不限于相关性、权威性、时效性、意图理解能力等;探索新的自然语言处理算法、信息检索技术、LLM适性索引、LLM相关性、生成式召回、排序大模型等,提高搜索引擎的准确性和智能化程度; 2)召回与排序:借助语义理解、个性化预估、机制设计等技术,解决超大规模的视频、商品、直播、POI等搜索业务下的召回、排序、重混排模型; 3)多模态、跨模态匹配技术:基于海量网页图文、抖音视频数据的大规模多模态预训练和视频分析技术,提升视觉搜索的使用体验;在搜索中结合CV+NLP深度学习技术,实现多模态、视频搜索、强大的语义理解和检索能力; 4)页面分析和摘要:从千亿视频/网页中提取最有价值的信息,进行结构化字段提取、智能摘要生成、转码等工作来优化搜索体验; 5)链接分析:从万亿链接中找出最有价值的网页,优化链接质量、索引质量、垃圾作弊识别、调度策略等。

更新于 2025-06-09北京