阿里云阿里云智能-搜索引擎技术专家-AI搜索引擎方向
任职要求
1、本科及以上学历,计算机相关专业背景; 2、具备扎实的编程基础和算法功底,良好的编程习惯,独立解决复杂问题的能力,熟悉C++/Python等编程语言; 3、有搜索相关领域研发经验和成果,熟悉搜索相关算法,如IVF、HNSW等,熟悉主流搜索引擎、向量引擎,如Elasticsearch、Milvus等; 4、对分布式系统、高性能存储、分布式缓存、各类存储引擎至少有一项…
工作职责
阿里云AI搜索引擎团队致力于构建下一代大模型驱动的AI原生搜索引擎,兼顾技术深度与业务价值实现,探索研究业界最新的搜索技术。在这里您将经历大模型带来的搜索技术变革以及超大规模分布式搜索、海量数据实时处理、复杂业务变化和创新带来的全方位技术挑战和机遇。参与包括但不限于大模型搜索引擎内核、AI搜索存储中间件、超大规模分布式搜索引擎等方面的架构设计与技术优化。用AI搜索技术帮助数以百万计的企业变革搜索体验和拉动业务增长。 您将承担以下核心职责: 1、结合业界最新的大模型技术、多模态技术和搜索引擎技术,设计和研发下一代AI搜索引擎内核,保持技术先进性并兼容开源生态; 2、设计和实现面向AI搜索场景的多模态数据存储中间件,负责攻关海量多模态数据低成本存储和高性能访问,内存与磁盘结合的混合存储等技术; 3、将大模型技术和搜索引擎技术相结合,利用大模型技术提升数据处理质量、优化搜索效果、革新搜索使用体验; 4、持续优化超大规模多模态数据在各业务场景的搜索效果和性价比,将新引擎落地到不同的业务场景。
【我们是谁】 你将加入阿里智能信息事业群的核心算法团队,直接负责 通义千问、夸克AI问答 等大模型产品背后至关重要的“大脑”—— RAG(检索增强生成)系统。我们的使命是为大模型打造一个专属的、下一代搜索引擎,确保AI在回答用户问题时,能做到响应快速、内容全面、信息时效性强且高度专业。 作为算法组内的工程中坚力量,你将负责高性能检索系统的架构设计与核心代码实现(以C++为主),是一个有意从工程转算法的理想岗位。 1. 构建极速引擎:负责RAG检索链路的工程落地,面对海量并发请求,通过极致的代码优化和架构设计,保障系统的高吞吐与低延迟。 2. 算法工程化落地:与算法专家紧密配合,将前沿的向量检索、倒排索引、重排等算法策略转化为稳定、高效的线上工程服务。 3. 系统架构升级:针对AI问答场景的特殊性(如长文本处理、实时索引更新),打造具备高可用、高扩展性的分布式后端服务体系,支撑未来AI搜索形态的快速演进。
1、专注于大模型联网场景的搜索引擎多语言能力的优化; 2、依据联网场景的特点和要求,制定并持续优化数据生产的标准与流程,保障标注准确性与实验有效性; 3、与算法团队、产品团队等密切协作,深度理解AI搜索项目的特点,积极提供有针对性的数据合成、数据评测等策略优化建议; 4、能够独立完成多语言方向数据挖掘、数据预处理、数据合成等工作,闭环验证数据在模型实验上的有效性,提升数据在联网场景能力上的可用性与价值。
我们是阿里巴巴国际数字商业集团-阿里巴巴国际站-Accio算法团队。阿里巴巴国际站是全球最大的跨境B2B数字化贸易平台。 1. 负责开发和优化新一代多模态AI搜索系统,包括但不限于多模态模型训练、跨模态生成与检索、多模态Agent等。 2. 负责搜索系统算法设计与实施,负责搜索系统中的多模态query理解、召回、相关性排序等关键模块的算法设计与优化。 3. 跟踪多模态大模型方向前沿问题的研究,将业界SOTA模型在业务场景进行产品化落地。
团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1)探索最前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2)探索跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3)探索大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4)探索千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务,方方面面都进行深入研究和创新。 1、参与搜索引擎研发,探索搜索全链路(分析、召回、粗排、精排、混排)的个性化行为建模,包括CTR、CVR预估、向量召回、价值混排、RAG、NLP、LLM、多模态、机器学习、深度学习等,推动搜索算法的落地与提升; 2、参与搜索算法的优化与迭代,提升转化效率、用户体验和供给生态; 3、深入参与搜索产品的需求设计,负责算法和工程的高质量交付,持续优化效果提升产品体验; 4、挖掘数据,构建Query理解、召回、排序等模型,提升搜索算法能力; 5、学习前沿技术,探索大模型等创新技术在AI搜索场景的落地。