哔哩哔哩搜索算法工程师(NLP/模型/策略方向)
任职要求
1、熟悉机器学习,数据挖掘,自然语言处理,推荐/搜索系统,多模态建模等一个或多个算法领域有扎实的理论基础和丰富的研发经验,对算法原理及应用有较深入的理解; 2、具备优秀的逻辑思维能力,对解决挑战性问题充满热情,善于分析和解决问题 3、具有很强的编程能力,至少熟练java/python/golang/c++其中一种开发语言。熟悉spark、hadoop、hive等大数据处理技术 4、有推荐/广告/搜索算法/大语言模型/CV/视频的工作经验,对相应系统和技术问题有充分理解
工作职责
1. 迭代召回模型,提升个性化能力 2. 迭代相关性模型/Query意图模型,深入理解用户意图,平衡相关性和效率 3. 优化视频内容的多模态模型,深入理解视频内容信息,服务全链路算法模块 4. 优化点击率、各类转化率、时长模型效果,提升模型的个性化能力,优化准度 5. 优化全链路排序策略,更好的平衡多目标,提升搜索结果页质量以及长期目标,如搜索渗透和留存
1.负责点评搜索相关性计算模块工作,包括相关性模型能力升级、模型策略线上调优等核心工作,提升搜索结果的精准度,为用户不断提供更好的搜索体验,从而驱动业务规模增长; 2.深度研究搜索领域内的前沿算法技术,基于搜索全链路,提出用户体验改善方案,并使用大语言模型等NLP技术持续性迭代优化; 3.和产品、运营等团队紧密合作,根据业务需求进行数据分析和模型优化,提供高效的、符合用户需求的搜索体验; 4.解决生产环境中的问题和异常,保障搜索服务的稳定运行。
团队介绍:字节跳动抖音搜索团队主要负责抖音搜索算法创新和架构研发工作,主要包括短视频、直播、本地生活、视觉搜索等多个业务线。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 1、参与抖音,今日头条,西瓜视频,剪映等App,以及国内电商,生活服务等重点业务的搜索推荐模型和策略改进,负责这些业务的搜索流量和用户渗透增长&搜索心智建设任务; 2、以推荐算法为核心技术栈,改进基于超大规模机器学习模型的推荐系统,覆盖从候选挖掘到召回,粗排,精排,多目标融合全链路技术环节; 3、探索短文本推荐和通用推荐技术的上限,重点是推荐和NLP技术的联合应用,以及多模态等前沿技术的探索。
团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 1、参与抖音,今日头条,西瓜视频,剪映等App,以及国内电商,生活服务等业务的搜索推荐模型和策略改进,负责这些业务的搜索流量和用户渗透增长&搜索心智建设任务; 2、以推荐算法为核心技术栈,改进基于超大规模机器学习模型的推荐系统,覆盖从候选挖掘到召回,粗排,精排,多目标融合全链路技术环节; 3、探索短文本推荐和通用推荐技术的上限,重点是推荐和NLP技术的联合应用,以及多模态等前沿技术的探索。
团队介绍:国际化短视频搜索团队主要负责国际化短视频的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括: 1、探索最前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 主要负责: 1、参与国际化短视频,以及国际化短电商,生活服务等重点业务的搜索推荐模型和策略改进,负责这些业务的搜索流量和用户渗透增长 & 搜索心智建设任务; 2、以推荐算法为核心技术栈,改进基于超大规模机器学习模型的推荐系统,覆盖从候选挖掘到召回,粗排,精排,多目标融合全链路技术环节; 3、探索短文本推荐和通用推荐技术的上限,重点是推荐和NLP技术的联合应用,以及多模态等前沿技术的探索。 业务介绍 1、搜索增长业务:团队负责的功能和场景,基本覆盖了绝大多数的搜索流量并且是过去TikTok搜索流量增长的最大原因。手段包含引导/激发/便捷化搜索发生之前的全流程,如主feed里视频/评论激发的推荐query场景,搜索前的输入补全和搜索后的结果相关搜索场景。 不仅为搜索带来更多流量,也使得流量本身的单位价值更高; 2、电商搜索增长业务:电商是app重要的变现手段,搜索作为其中货架心智建设的关键一环,电商搜索流量的增长和心智的建立,在其中起到重要作用; 3、搜索与端的结合:作为搜索业务,同样负责fyp排序里搜索相关的排序逻辑,改变端的生态激发用户搜索探索更多内容的意愿。并且用用户的搜索行为,为用户提供更好的feed浏览体验。