字节跳动国际化短视频算法专家-搜索
任职要求
1、优秀的代码能力、数据结构和基础算法功底,熟练C/C++或Python; 2、掌握或精通相关核心算法方向,有深刻理解和实际应用经验,包括不限于: 1)熟悉或掌握搜索/广告/推荐等大规模机器学习技术,包括召回/排序/纠错/文本理解等; 2)熟悉或掌握NLP相关的技术,包括预训练/知识库/语义分析等; 3)熟悉或了解大模型相关的技术,包括CT/SFT/RM等算法原理,有实际经验者优先; 4)在机器学习/搜索/大模型等领域会议发表过高质量论文者优先; 3、有丰富的从业经历,深耕搜索方向者优先,或在其他相关方向取得突出成果,对搜索有热情和兴趣; 4、有强烈的技术好奇心、自驱力和进取心,出色的问题分析和解决能力; 5、具备一定的算法团队意识,能够紧跟前沿技术发展,设计和规划中长期发展思路、目标和路线。
工作职责
1、负责国际化短视频具体业务场景的搜索等算法工作,深度理解业务,攻克解决策略问题; 2、负责与产品运营团队对接协作,在本地生活等垂类、大模型应用等创新方向持续优化算法,支持业务目标达成; 3、负责前沿技术创新驱动与业务深度结合与应用,包括但不限于内容理解/信息抽取/多模态/大模型/文本生成/检索与相关性等领域; 4、负责搜索业务策略方向的中长期规划工作,包括技术演进、业务支撑、团队成长等方向。
1、领导算法团队: 负责公司重点国际化短视频产品,带领算法团队成员,设定团队目标,并指导团队成员在搜索链路、LLM和算法应用方面的发展; 2、LLM模型应用落地:负责LLM应用在搜索业务场景,优化搜索排序机制与信息效率,并探索多语言预训练,多模态融合等,探索LLM时代搜索的理想形态; 3、算法研究与开发: 参与算法研究与开发工作,提升模型性能和算法效率,并持续关注学术界的最新进展; 4、项目规划与管理: 参与项目规划与管理,制定项目计划,确保项目按时交付,并保证项目的高质量完成; 5、技术优化与创新: 不断优化现有的算法技术,并推动算法创新,以提高业务效果和用户体验; 6、跨团队合作: 与产品团队、工程团队和业务团队紧密合作,理解业务需求,将算法技术转化为实际的产品和解决方案;算法评估与改进: 负责对算法模型进行评估和改进,提高算法的准确性、效率和可解释性。
1、负责国际化短视频搜索业务的算法优化,包括召回/粗排/精排/混排/个性化等,从模型、策略和机制等角度全面优化搜索体验,满足用户个性化需求; 2、深入洞察业务数据,分析潜在的问题并提出策略提升方向,不断提升迭代模型效果,促进业务效果提升; 3、利用LLM构建垂类策略场景中模型基座,提升效果的天花板和模型统一性。
团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。
团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 1、探索搜索引擎与大模型、LLM、MLLM、多模态、机器学习、强化学习等前沿技术的结合,实现搜索引擎全链路革新并进行极致的系统优化,探索提升AI搜索引擎的能力,包含而不限于相关性、权威性、时效性、意图理解能力等;探索LLM适性索引、LLM相关性、生成式召回、排序大模型等; 2、构建大规模高质量数据(数据建设、数据抓取与解析、数据合成等)、训练和优化AI搜索的机器学习模型(多模态内容理解、指令微调、索引筛选、Query分析、Scalable Oversight、Long CoT、模型推理/规划、模型优化、构建全面客观准确的评测体系等); 3、探索推进AI搜索、AIGC创新应用的落地(包含而不限于豆包、电商、抖音、智能硬件、AI找搭配/虚拟穿搭等大模型应用场景),研发以人工智能技术为核心的新技术、新产品,探索满足用户的智能交互需求,提升现实与物理世界的交互能力。