logo of baidu

百度AI Search引擎高级研发工程师(J84193)

社招全职ACG地点:北京 | 上海 | 深圳 | 成都状态:招聘

任职要求


-熟悉C++/Java等编程语言,熟悉数据结构算法等基础知识
-熟悉系统结构原理和编程(多线程编程、网络编程高并发性能调优)
-有较强的责任心,良好的沟通协作能力,较强的学习能力
-加分项:熟悉常见的大数据组件和数据库原理和源代码(包括但不限于doris, clickhouse, esimpala, presto, greenplum, snowflake, mysql,  oracle, sql server,各种向量数据库 等)
-加分项:熟悉存储系统原理和源代码(包括但不限于 hbase, kudu, rocksdb, parquet, ceph,对象存储, 云磁盘等)
-有大模型数据基础设施和应用的研发经验,如RAG相关

工作职责


-建设面向AI场景的检索引擎(多维分析、文本检索、向量检索、多模检索等)
-负责计算引擎:包括但不限于SQL解析规划器,查询优化器,分布式执行研发和优化
-负责存储引擎:包括单机执行引擎,资源调度,列式存储、存算分离等模块的研发和优化
-负责各集群服务稳定性保障和客户支持
包括英文材料
C+++
Java+
数据结构+
算法+
多线程+
网络编程+
高并发+
性能调优+
大数据+
Doris+
ClickHouse+
Impala+
Presto+
Greenplum+
Snowflake+
SQL+
MySQL+
Oracle+
SQL Server+
HBase+
Kudu+
RocksDB+
Parquet+
Ceph+
大模型+
RAG+
相关职位

logo of meituan
社招核心本地商业-业

1. 负责Agentic Search(搜索智能体)技术探索和架构研发,支持深度搜索、多模态(文本、图像、视频)检索等应用创新; 2. 设计并实现AI搜索的落地应用,包括利用大模型进行Query理解、任务分解、环境感知、语义检索、校验反思、总结归纳等模块的模型算法优化; 3. 构建和维护面向AI搜索的高质量的检索库,制定完善的数据清洗、标注和预处理规范流程,完成亿级规模检索库的索引与优化,利用AI技术扩充和丰富检索数据,提升检索系统的泛化能力和鲁棒性; 4. 与业务部门(如产品、运营团队)协作,将AI搜索能力嵌入现有工作流(如搜索引擎、智能问答、个性化推荐等),支撑美团场景落地应用。

更新于 2025-04-22
logo of meituan
社招3年以上核心本地商业-业

​AI搜索和智能体产品后端系统研发: 1. 设计并实现AI搜索Agent应用,包括Query理解、记忆存储、环境感知等模块的集成与优化。 2. 负责Agentic Search(搜索智能体)技术探索和架构研发,支持多模态(文本、图像、视频)检索与应用创新。 3. 抽象并开发企业级别的AI应用平台,支持Agent相关应用的接入与扩展,确保平台的高可用性和可扩展性。 4. 实现平台的模块化设计,支持快速迭代与功能扩展,满足AI时代本地生活服务领域智能体应用快速发展需求。 5. 与业务部门(如产品、运营团队)协作,将AI搜索能力嵌入现有工作流(如智能问答、个性化推荐)。 6. 负责AI系统的日常运维,包括异常监控、接口优化及用户培训,确保生产环境高效运行。

更新于 2025-04-03
logo of bytedance
校招A07472

Team Introduction: The Search Team is primarily responsible for the innovation of search algorithm and architecture research and development (R&D) for products such as Douyin, Toutiao, and Xigua Video, as well as businesses like E-commerce and Local Services. We leverage cutting-edge machine learning technologies for end-to-end modeling and continuously push for breakthroughs. We also focus on the construction and performance optimization of distributed and machine learning systems — ranging from memory and disk optimization to innovations in index compression and exploration of recall and ranking algorithms — providing students with ample opportunities to grow and develop themselves. The main areas of work include: 1. Exploring Cutting-Edge NLP Technologies: From basic tasks like word segmentation and Named Entity Recognition (NER) to advanced business functions like text and multimodal pre-training, query analysis, and fundamental relevance modeling, we apply deep learning models throughout the pipeline where every detail presents a challenge. 2. Cross-Modal Matching Technologies: Applying deep learning techniques that combine Computer Vision (CV) and Natural Language Processing (NLP) in search, we aim to achieve powerful semantic understanding and retrieval capabilities for multimodal video search. 3. Large-Scale Streaming Machine Learning Technologies: Utilising large-scale machine learning to address recommendation challenges in search, making the search more personalized and intuitive in understanding user needs. 4. Architecture for data at the scale of hundreds of billions: Conducting in-depth research and innovation in all aspects, from large-scale offline computing and performance and scheduling optimization of distributed systems to building high-availability, high-throughput, and low-latency online services. 5. Recommendation Technologies: Leveraging ultra-large-scale machine learning to build industry-leading search recommendation systems and continuously explore and innovate in search recommendation technologies. 团队介绍: 字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 课题背景/目标: 随着大模型技术的快速发展,智能搜索领域迎来了新的机遇和挑战。传统搜索技术在面对海量数据、多模态信息以及用户复杂需求时,逐渐暴露出模型容量不足、语义理解能力有限、资源利用率低等问题。基于大模型的智能搜索构建旨在通过引入大模型技术,提升搜索系统的智能化水平,优化用户体验,并解决超大规模检索、复杂语义理解、资源高效利用等核心问题。具体目标包括: 1、探索大模型与排序算法的结合,提升个性化排序的精度和用户体验; 2、研究生成式检索算法,解决百亿乃至千亿级别候选库的超大规模检索问题; 3、利用大语言模型(LLM)提升复杂多义query的搜索满意度; 4、构建高性能、低资源消耗的大规模批流一体检索和计算系统,提升资源利用率。 课题挑战/必要性: 1、个性化排序的挑战:传统排序算法难以充分利用多模态信息(如文本、图像、视频等),且模型复杂度有限,无法满足用户对精准化和个性化搜索的需求; 2、超大规模检索的挑战:传统判别式模型在千亿级别候选库的检索中,面临模型容量不足、索引效率低下等问题,亟需新一代检索算法; 3、复杂query理解的挑战:用户搜索需求日益复杂,传统搜索引擎难以准确理解长难句、多义query的语义,导致搜索结果满意度低; 4、资源利用率的挑战:搜索系统存储和计算分离的架构导致资源利用率低,如何在保证性能的同时优化资源使用成为关键问题; 5、基于大模型的智能搜索构建是解决上述挑战的必要途径。通过引入大模型技术,可以显著提升搜索系统的语义理解能力、检索效率和资源利用率,从而为用户提供更精准、更高效的搜索体验。 课题内容: 1、个性化排序大模型研究; 2、超大规模生成式检索算法研究; 3、基于LLM提升复杂多义query的搜索满意度; 4、高性能大规模批流一体检索和计算系统。 涉及的研究方向:排序大模型、生成式检索与跨模态融合、大语言模型(LLM)与复杂query理解、高性能计算与存储架构。

更新于 2025-05-26
logo of tongyi
校招通义2026届秋

我们正在寻找业界顶尖的系统专家,加入我们的AI基础架构团队,共同设计和构建下一代生成式AI的“在线服务操作系统”。您的使命是解决将前沿AI能力(大模型、AI Agent、多模态等)转化为大规模、高效率、高可用在线服务时所面临的系统性、全栈性挑战。您将负责端到端的服务性能与架构演进,从顶层应用到底层硬件,全面提升AI服务的竞争力。 具体职责包括(若你对以下一个或者多个方向感兴趣均欢迎投递): 1. 大规模模型服务平台与智能调度系统设计: (1)负责承载大规模在线模型服务(Serving)平台的核心架构设计与演进,通过对底层推理引擎(如PAI平台提供)的深度适配与协同优化,实现极致的推理吞吐与资源利用率。 (2)设计并实现面向复杂混合负载(长/短序列长度、多Lora、多模型、异构资源、多租户、高/低优先级)的上层智能请求调度与资源管理系统,通过与推理引擎的深度协同,动态调整调度策略,保障服务质量(SLA)并最大化云上服务的性价比。 2. 分布式基础设施与底层硬件优化: (1)负责面向大规模模型服务的分布式推理拓扑管理与通信计算协同优化,针对张量并行、流水线并行等场景,优化跨节点通信(InfiniBand/RoCE, NVLink),降低端到端延迟。 (2)深入理解GPU、NPU等异构硬件架构与特性,负责从服务层面对底层计算、编译优化(由PAI等引擎团队提供)进行性能评测、分析与反馈,驱动端到端的硬件效能提升。 3. AI应用层运行时与算法协同优化: (1)深入AI Agent、检索增强生成(RAG)、多模态理解等复杂应用场景,设计并优化其专用的高效运行时(Runtime),解决长链条、多依赖、异步任务流的性能瓶颈。 (2)负责高性能向量检索(Vector Search)与图计算(Graph Computing)引擎的服务化与集成,优化其在RAG和复杂推理场景下的数据访问与计算效率,实现数据层与模型层的无缝高效协同。

更新于 2025-08-07