字节跳动搜索算法工程师-Data
任职要求
1、出色的分析问题、解决问题能力,总是能从纷繁复杂的数据中一眼看出问题本质; 2、出色的机器学习(Deep Learning)、NLP和数据挖掘基础,并能很好地建模应用于…
工作职责
团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。
1、负责内部MonoTorch训练框架的研究与开发,服务于搜索,广告、推荐等场景; 2、负责实时高性能推理系统设计与开发,如算子融合、编译优化、模型量化、混合精度、异构硬件加速等; 3、负责性能优化与架构升级,持续提升数据预处理/训练/推理性能; 4、与算法工程师深度合作,为重点项目进行算法与系统的联合优化。
1、负责内部机器学习平台训练框架的研究与开发(包括数据预处理/训练/推理),服务于广告、推荐、搜索等场景; 2、负责实时高性能推理系统设计与开发,如算子融合、编译优化、模型量化、混合精度、异构硬件加速等; 3、负责性能优化与架构升级,持续提升数据预处理/训练/推理性能; 4、与算法工程师深度合作,为重点项目进行算法与系统的联合优化。
1、负责机器学习引擎的设计与开发; 2、具体场景包括: 1)内部机器学习平台训练框架的研究与开发(包括数据预处理/训练/推理),服务于广告、推荐、搜索等场景; 2)实时高性能推理系统设计与开发,如算子融合、编译优化、模型量化、混合精度、异构硬件加速等; 3)性能优化与架构升级,持续提升数据预处理/训练/推理性能; 4)与算法工程师深度合作,为重点项目进行算法与系统的联合优化。
团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、支持火山方舟大模型的应用落地,将字节跳动的内容与大模型相结合,为用户提供更智能的信息服务; 2、探索最前沿的NLP技术,将深度学习模型应用到用户Query分析、Query改写等方向,充分理解用户; 3、利用NLP技术以及大模型技术,对内容进行分析、理解,完成内容打标、内容摘要等信息的生成和提取; 4、通过外挂知识库模式,在内容搜索领域不断探索,使用NLP、多模态技术进行高质量内容召回; 5、将大模型技术和Ranking技术结合,解决内容排序问题。