百度搜索架构工程师(J85361)
任职要求
-精通Linux/Unix平台上的C/C++语言编程 -对数据结构和算法设计具有较深刻的理解 -熟悉网络编程、并发式编程,熟悉Linux系统知识 -优秀的分析和解决问题的能力,对挑战性问题充满激情 -良好的团队合作精神,较强的沟通能力和学习能力 -渴望技术创新,渴望用技术改变世界 -有深度学习、GPU 优化相关经验者优先 -有CUDA编程经验者优先 大数据工程师 负责百度搜索千亿海量数据的计算、存储、传输、生效等。使用分布式计算、分布式存储、流式计算框架,机器学习等技术不断优化系统架构,提升系统时效性、灵活性、扩展性等。研究高稳定性、高可用性的搜索引擎数据系统架构设计。
工作职责
-负责搜索在线架构,包括文本搜索、视频搜索、图片搜索、语音检索、视觉检索、资讯/热议等各类搜索系统的架构研发工作 -负责服务治理与重构、云原生架构改造、搜索性能优化,保证搜索系统的可扩展性与可持续发展 -负责高并发架构机制、稳定性工程、检索延时优化、数据流系统研发,保证搜索系统全面可用性 -负责机器学习应用落地与智能化语义检索,提升搜索的智能化水平 -负责基础检索、排序架构、展现架构机制革新,支持用户体验、内容生态的革新
我们致力于构建全球领先的AI异构计算加速引擎和加速平台。建立融合推理(Inference)、训练(Training)的软硬件一体的AI计算加速解决方案,并应用于行业最大的规模的AI数据中心,解决云计算、搜索、信息流、图像、视觉、语音、自然语言处理等的算法优化与计算加速问题。 -负责大规模AI前向计算引擎(Inference Engine)框架和底层算子开发与优化; -负责大规模AI计算通信库及通信算法开发与优化; -负责面向CPU/GPU/FPGA/ASIC等多元化计算架构的编译系统开发、编译优化和算法加速; -负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化。
团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索最前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 1、参与头条/抖音等核心产品的搜索引擎研发工作,服务数亿海量用户; 2、参与搜索引擎核心架构设计与开发,可能的方向包括: (1)设计开发千亿级网页搜索的数据流、分布式建库、在线检索系统,设计和自研业内领先的检索架构; (2)设计面向视频、图文、电商等不同体裁的大规模数据处理平台,研发业界领先的搜索建库系统; (3)设计开发万亿级Spider系统的实时计算、调度分发、压力控制、蜘蛛抓取等服务; (4)设计开发高可用的搜索引擎稳定性解决方案、持续优化服务性能,提供高吞吐、低延迟、高可用的搜索在线服务; (5)跟进业界技术趋势,推动新技术、新方法在 spider、建库、检索系统、ranking 架构应用落地。
团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索最前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 1、参与头条/抖音等核心产品的搜索引擎研发工作,服务数亿海量用户; 2、参与搜索引擎核心架构设计与开发,可能的方向包括: (1)设计开发千亿级网页搜索的数据流、分布式建库、在线检索系统,设计和自研业内领先的检索架构; (2)设计面向视频、图文、电商等不同体裁的大规模数据处理平台,研发业界领先的搜索建库系统; (3)设计开发万亿级Spider系统的实时计算、调度分发、压力控制、蜘蛛抓取等服务; (4)设计开发高可用的搜索引擎稳定性解决方案、持续优化服务性能,提供高吞吐、低延迟、高可用的搜索在线服务; (5)跟进业界技术趋势,推动新技术、新方法在 spider、建库、检索系统、ranking 架构应用落地。
团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索最前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 1、参与今日头条/抖音等核心产品的搜索引擎研发工作,服务数亿海量用户; 2、参与搜索引擎核心架构设计与开发,可能的方向包括: 1)设计开发千亿级网页搜索的数据流、分布式建库、在线检索系统,设计和自研业内领先的检索架构; 2)设计面向视频、图文、电商等不同体裁的大规模数据处理平台,研发业界领先的搜索建库系统; 3)设计开发万亿级Spider系统的实时计算、调度分发、压力控制、蜘蛛抓取等服务; 4)设计开发高可用的搜索引擎稳定性解决方案、持续优化服务性能,提供高吞吐、低延迟、高可用的搜索在线服务; 5)跟进业界技术趋势,推动新技术、新方法在Spider、建库、检索系统、Ranking架构应用落地。