logo of bytedance

字节跳动NLP算法工程师-国际化搜索

社招全职A142408地点:北京状态:招聘

任职要求


1、出色的机器学习深度学习基础能力,在NLP、CV、机器学习LLM等方面有一定的应用经验;
2、扎实的代码能力、数据结构和基础算法功底;
3、出色的分析问题、解决问题能力;
4、熟悉Linux开发环境,熟练使用C++Python语言;
5、有搜索算法经验者加分。

工作职责


1、参与国际化短视频搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验;
2、参与国际化短视频搜索算法改进,可选的方向包括:
(1)探索前沿NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;
(2)跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,使搜索在上述业务中拥有更强大的检索能力;从事视频搜索、视觉搜索等相关算法的研究与开发工作,包括视频内容理解、视觉表征学习、多模态融合等;
(3)个性化搜索:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;
(4)千亿级数据:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。
包括英文材料
机器学习+
深度学习+
NLP+
大模型+
数据结构+
算法+
Linux+
C+++
Python+
相关职位

logo of bytedance
社招A222747

1、负责国际化短视频新产品落地,研究基于新技术在搜索、推荐、对话等领域的全新应用形态和解决方案,满足用户不断增长的智能交互需求,全面提升用户使用产品的体验,激发创造、提供价值; 2、提升对话交互的体验,对当前新技术的能力边界进行扩展,如搜索增强、引入插件等; 3、应用最新技术提升搜索、推荐等系统的效果,包括数据生产、模型训练/蒸馏、性能调优等; 4、跟踪业界前沿技术,如提示工程、指令调优、插件选择,在业务中实践落地; 5、对未来的更多应用场景进行深入研究和探索,保持团队技术处于靠前梯队。

更新于 2023-10-26
logo of bytedance
社招5年以上A126418A

国际化搜索广告团队不断突破通用搜索引擎变现的界限,覆盖海外应用,致力于构建全球领先的搜索广告变现系统。在国际化搜索广告团队,您将有机会从事大规模分布式存储和架构、自然语言处理、排序和信息检索相关的问题。您还将深入参与我们的广告样式、创意展示和广告投放链路的创新和优化。我们正在寻找勇于挑战困难、热衷于解决复杂问题并与热情洋溢的候选人们共同发展我们的搜索广告产品。 1、参与大规模广告系统的开发; 2、使用机器学习参与广告投放的开发和迭代,参与点击率/转化率模型估计准确性、数据分析、建模、特征工程; 3、参与自然语言处理 (NLP) 能力的提升和查询理解,例如查询分类、seq2seq、实体识别 (NER)、知识图谱、关键词优化等; 4、负责相关性模型和策略优化,例如语义匹配模型、主动学习、文本/照片/视频多模型、排序策略等; 5、 研究和开发广告定向、出价算法、广告流量控制等; 6、 与产品经理和产品战略与运营团队合作,定义产品策略和功能。

更新于 2023-04-19
logo of bytedance
社招A90163

1、参与国际化短视频业务中的搜索及相关算法工作,深度理解业务,解决和跟进一线业务问题; 2、与产品运营团队紧密协作,在本地生活等垂类、AI大模型应用等创新方向持续迭代优化算法效果,达成业务目标; 3、结合业务场景挑战,跟踪前沿领域研究成果,推动技术创新在业务场景的深度应用,包括但不限于内容理解/信息抽取/多模态/大模型/文本生成/检索与相关性等算法领域。

更新于 2024-10-21
logo of bytedance
校招A10718

团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新;5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 课题介绍:随着大模型技术的快速发展,智能搜索领域迎来了新的机遇和挑战。传统搜索技术在面对海量数据、多模态信息以及用户复杂需求时,逐渐暴露出模型容量不足、语义理解能力有限、资源利用率低等问题。基于大模型的智能搜索构建旨在通过引入大模型技术,提升搜索系统的智能化水平,优化用户体验,并解决超大规模检索、复杂语义理解、资源高效利用等核心问题。具体目标包括: 1、探索大模型与排序算法的结合,提升个性化排序的精度和用户体验; 2、研究生成式检索算法,解决百亿乃至千亿级别候选库的超大规模检索问题; 3、利用大语言模型(LLM)提升复杂多义Query的搜索满意度。 1、参与字节跳动搜索引擎研发工作,用最前沿的机器学习算法、海量的数据,做最激动人心的技术、给用户最好的搜索体验; 2、参与今日头条/抖音/电商/国际化电商等产品的搜索研发工作,服务相关产品数亿用户; 3、参与搜索核心算法改进,可选的方向包括: 1)探索前沿NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2)跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,使搜索在上述业务中拥有更强大的检索能力; 3)个性化搜索:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4)千亿级数据:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。

更新于 2025-06-09