字节跳动搜索架构工程师
社招全职DJH1地点:北京状态:招聘
任职要求
1、具备扎实的计算机理论基础、出色的编码能力、出色的数据结构和基础算法功底; 2、出色的分析问题、解决问题能力,追求优雅的架构设计,对挑战技术难题充满激情; 3、熟悉Linux环境下性能调优、有大规模C++在线服务研发经验者优先; 4、有主流大规模推荐/搜索引擎架构研发经验者优先; 5、熟悉分布式系统…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索最前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 1、参与今日头条/抖音等核心产品的搜索引擎研发工作,服务数亿海量用户; 2、参与搜索引擎核心架构设计与开发,可能的方向包括: 1)设计开发千亿级网页搜索的数据流、分布式建库、在线检索系统,设计和自研业内领先的检索架构; 2)设计面向视频、图文、电商等不同体裁的大规模数据处理平台,研发业界领先的搜索建库系统; 3)设计开发万亿级Spider系统的实时计算、调度分发、压力控制、蜘蛛抓取等服务; 4)设计开发高可用的搜索引擎稳定性解决方案、持续优化服务性能,提供高吞吐、低延迟、高可用的搜索在线服务; 5)跟进业界技术趋势,推动新技术、新方法在Spider、建库、检索系统、Ranking架构应用落地。
包括英文材料
数据结构+
https://www.youtube.com/watch?v=8hly31xKli0
In this course you will learn about algorithms and data structures, two of the fundamental topics in computer science.
https://www.youtube.com/watch?v=B31LgI4Y4DQ
Learn about data structures in this comprehensive course. We will be implementing these data structures in C or C++.
https://www.youtube.com/watch?v=CBYHwZcbD-s
Data Structures and Algorithms full course tutorial java
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
Linux+
https://ryanstutorials.net/linuxtutorial/
Ok, so you want to learn how to use the Bash command line interface (terminal) on Unix/Linux.
https://ubuntu.com/tutorials/command-line-for-beginners
The Linux command line is a text interface to your computer.
https://www.youtube.com/watch?v=6WatcfENsOU
In this Linux crash course, you will learn the fundamental skills and tools you need to become a proficient Linux system administrator.
https://www.youtube.com/watch?v=v392lEyM29A
Never fear the command line again, make it fear you.
https://www.youtube.com/watch?v=ZtqBQ68cfJc
性能调优+
https://goperf.dev/
The Go App Optimization Guide is a series of in-depth, technical articles for developers who want to get more performance out of their Go code without relying on guesswork or cargo cult patterns.
https://web.dev/learn/performance
This course is designed for those new to web performance, a vital aspect of the user experience.
https://www.ibm.com/think/insights/application-performance-optimization
Application performance is not just a simple concern for most organizations; it’s a critical factor in their business’s success.
https://www.oreilly.com/library/view/optimizing-java/9781492039259/
Performance tuning is an experimental science, but that doesn’t mean engineers should resort to guesswork and folklore to get the job done.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
还有更多 •••
相关职位
社招3-5年J0012
1、负责搜索C端业务需求的研发与实现; 2、负责搜索业务基础架构模块的升级与维护,提升搜索产品研发效率; 3、负责搜索容器产品及平台的的底层核心服务能力建设,借助云原生相关技术提升搜索引擎系统的平台化程度,实现搜索引擎的产品化; 4、负责搜索各类平台系统间的整体优化与整合,提升平台系统的稳定性/通用性/研发与使用效率。
更新于 2025-08-07北京
社招D2867
1、参与快手搜索引擎研发工作,服务数亿海量用户; 2、参与搜索引擎核心架构设计与开发,涵盖的方向包括: (1)负责前沿ANN算法与引擎的研发,实现大容量、高吞吐、高精度、低成本的向量检索引擎,持续构建业界领先的技术能力; (2)负责自研百亿规模的视频、网页,商品等多类资源的检索系统研发,包括且不限于高效的建库系统,高性能的检索引擎; (3)面向搜广推业务,建设统一的检索平台,有机融合ANN,倒排等多类检索引擎,提供极致效率的建库,服务,运维体验。 3、探索AI检索新技术、新思想的应用和落地。
更新于 2025-04-03北京
社招3年以上核心本地商业-业
AI搜索和智能体产品后端系统研发: 1. 设计并实现AI搜索Agent应用,包括Query理解、记忆存储、环境感知等模块的集成与优化。 2. 负责Agentic Search(搜索智能体)技术探索和架构研发,支持多模态(文本、图像、视频)检索与应用创新。 3. 抽象并开发企业级别的AI应用平台,支持Agent相关应用的接入与扩展,确保平台的高可用性和可扩展性。 4. 实现平台的模块化设计,支持快速迭代与功能扩展,满足AI时代本地生活服务领域智能体应用快速发展需求。 5. 与业务部门(如产品、运营团队)协作,将AI搜索能力嵌入现有工作流(如智能问答、个性化推荐)。 6. 负责AI系统的日常运维,包括异常监控、接口优化及用户培训,确保生产环境高效运行。
更新于 2025-04-03北京