阿里云阿里云智能-搜索引擎技术专家-AI搜索引擎方向
任职要求
1、本科及以上学历,计算机相关专业背景; 2、具备扎实的编程基础和算法功底,良好的编程习惯,独立解决复杂问题的能力,熟悉C++/Python等编程语言; 3、有搜索相关领域研发经验和成果,熟悉搜索相关算法,如IVF、HNSW等,熟悉主流搜索引擎、向量引擎,如Elasticsearch、Milvus等; 4、对分布式系统、高性能存储、分布式缓存、各类存储引擎至少有一项有了解或有项目经验,主导过存储系统项目研发者优先;有FAST/OSDI等顶会发表存储相关论文或Ceph、JuiceFS、Alluxio等相关开源项目核心模块开发经验者优先; 5、在搜索引擎相关领域国际顶级会议、期刊发表论文,或相关学术会议组织的权威比赛中获奖者优先; 6、严谨踏实,责任心强,具备很强的学习能力和持续创新的意识,能够跟踪行业技术动态并应用到实际工作中。
工作职责
阿里云AI搜索引擎团队致力于构建下一代大模型驱动的AI原生搜索引擎,兼顾技术深度与业务价值实现,探索研究业界最新的搜索技术。在这里您将经历大模型带来的搜索技术变革以及超大规模分布式搜索、海量数据实时处理、复杂业务变化和创新带来的全方位技术挑战和机遇。参与包括但不限于大模型搜索引擎内核、AI搜索存储中间件、超大规模分布式搜索引擎等方面的架构设计与技术优化。用AI搜索技术帮助数以百万计的企业变革搜索体验和拉动业务增长。 您将承担以下核心职责: 1、结合业界最新的大模型技术、多模态技术和搜索引擎技术,设计和研发下一代AI搜索引擎内核,保持技术先进性并兼容开源生态; 2、设计和实现面向AI搜索场景的多模态数据存储中间件,负责攻关海量多模态数据低成本存储和高性能访问,内存与磁盘结合的混合存储等技术; 3、将大模型技术和搜索引擎技术相结合,利用大模型技术提升数据处理质量、优化搜索效果、革新搜索使用体验; 4、持续优化超大规模多模态数据在各业务场景的搜索效果和性价比,将新引擎落地到不同的业务场景。
1、专注于大模型联网场景的搜索引擎多语言能力的优化; 2、依据联网场景的特点和要求,制定并持续优化数据生产的标准与流程,保障标注准确性与实验有效性; 3、与算法团队、产品团队等密切协作,深度理解AI搜索项目的特点,积极提供有针对性的数据合成、数据评测等策略优化建议; 4、能够独立完成多语言方向数据挖掘、数据预处理、数据合成等工作,闭环验证数据在模型实验上的有效性,提升数据在联网场景能力上的可用性与价值。
1、负责支付宝APP搜索品研发,能深入理解产品和参与业务,迭代优化产品,负责搜索推荐在线/离线全链路架构设计,支撑业务快速发展; 2、负责搜索推荐领域关键技术预研和技术难点攻关,推进平台化建设,提升迭代效率,构建高可靠性、高性能、高可扩展性的系统; 3、关注AI相关系统前沿方向发展,包括不仅限于生成式AI、机器学习、向量检索、索引、排序、图数据库、大数据技术等,前瞻性地探索新型AI搜索系统架构设计,并推动落地。
我们是阿里巴巴国际数字商业集团-阿里巴巴国际站-Accio算法团队。阿里巴巴国际站是全球最大的跨境B2B数字化贸易平台。 1. 负责开发和优化新一代多模态AI搜索系统,包括但不限于多模态模型训练、跨模态生成与检索、多模态Agent等。 2. 负责搜索系统算法设计与实施,负责搜索系统中的多模态query理解、召回、相关性排序等关键模块的算法设计与优化。 3. 跟踪多模态大模型方向前沿问题的研究,将业界SOTA模型在业务场景进行产品化落地。
团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1)探索最前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2)探索跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3)探索大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4)探索千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务,方方面面都进行深入研究和创新。 1、参与搜索引擎研发,探索搜索全链路(分析、召回、粗排、精排、混排)的个性化行为建模,包括CTR、CVR预估、向量召回、价值混排、RAG、NLP、LLM、多模态、机器学习、深度学习等,推动搜索算法的落地与提升; 2、参与搜索算法的优化与迭代,提升转化效率、用户体验和供给生态; 3、深入参与搜索产品的需求设计,负责算法和工程的高质量交付,持续优化效果提升产品体验; 4、挖掘数据,构建Query理解、召回、排序等模型,提升搜索算法能力; 5、学习前沿技术,探索大模型等创新技术在AI搜索场景的落地。