蚂蚁金服蚂蚁集团-RAG检索算法工程师-杭州【AI Force】
任职要求
1. 计算机、数学或统计学相关专业硕士及以上学历,2年以上工作经验。 2. 有RAG相关工作经验。 3.优秀的代码能力、数据结构和基础算法功底。 4. 熟练使用Python或者java等编程语言,有pytorch等深度学习框架使用经验。 5. 符合以下条件之一者优先: A)有大模型应用; B)CCF-A类论文一作。
工作职责
1. 负责智能客服Agent中,RAG系统的建设和优化。包括: a. 供给理解:如GraphRAG构建、供给标签体系构建、知识自动化挖掘、多模态文档拆条等 b. Query理解:如原声改写、实体抽取等 c. 检索规划:策划改写等 d. 搜索优化:包括召回、精排、混排各环节算法优化 e. 系统建设:配合工程完成RAG全链路建设和优化升级 2. 持续跟踪RAG领域前沿技术,产出创新型成果。
1、聚焦大模型的应用侧创新,包括RAG检索增强/Agent复杂规划执行能力、LLM可控知识生产、LLM推理加速等问题,解决大模型业务落地的技术障碍; 2、协同跨团队技术和业务同学共同达成技术和业务目标; 3、NLP大模型前沿探索,推动大模型子领域的技术创新,沉淀行业领先的技术能力。
负责基于大模型技术,打造闲鱼平台智能化服务产品与基础AI设施建设,提升商品交易效率与用户体验,具体职责包括但不限于以下方向: 1、AI应用研发 * 构建智能托售引擎,基于多模态大模型实现商品自动描述生成、智能定价等,优化卖家商品发布效率与转化率; * 开发多模态对话式助手,支持自然语言交互的商品管理(如上架、改价、咨询回复),降低卖家运营门槛; * 设计买家需求理解与智能撮合系统,通过意图识别、长对话状态跟踪技术提升买卖双方匹配效率; * 构建卖家经营分析工具,基于大模型生成数据洞察报告与自动化营销方案,赋能商家精细化运营; * AI风控智能化教育,拦截,和诊断,结合知识库和大模型分析做智能风控智能体。 2、 AI基础建设 * 针对会话理解,研发轻量化大模型框架,支持复杂多任务推理,如会话意图,会话理解标签; * 针对二手交易场景,微调行业专属多模态大模型,建设高精度商品知识库与RAG检索增强能力。 3、业务技术建设 *结合实际业务需求,开展多模态大模型、强化学习等方向的探索与创新研究,撰写并发表高水平论文,与业界和学术界保持深度互动,推动技术进步。
1. 构建会议AI算法工程体系(评测系统、监控系统、标注系统、AI Agent架构) 2. 会议AI基础模型的接入和优化(模型调研、训练和推理,算法工程建设) 3. AI产品的功能完善,智能化提升(AI听记、会议AI助理等线上产品的开发) 4. AI解决方案的设计和应用落地(找到具有客户价值的落地场景,真正为客户解决问题)
团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新;5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 课题介绍:随着大模型技术的快速发展,智能搜索领域迎来了新的机遇和挑战。传统搜索技术在面对海量数据、多模态信息以及用户复杂需求时,逐渐暴露出模型容量不足、语义理解能力有限、资源利用率低等问题。基于大模型的智能搜索构建旨在通过引入大模型技术,提升搜索系统的智能化水平,优化用户体验,并解决超大规模检索、复杂语义理解、资源高效利用等核心问题。具体目标包括: 1、探索大模型与排序算法的结合,提升个性化排序的精度和用户体验; 2、研究生成式检索算法,解决百亿乃至千亿级别候选库的超大规模检索问题; 3、利用大语言模型(LLM)提升复杂多义Query的搜索满意度。 1、参与搜索引擎研发,探索搜索全链路(分析、召回、粗排、精排、混排)的个性化行为建模,包括CTR、CVR预估、向量召回、价值混排、RAG、NLP、LLM、多模态、机器学习、深度学习等,推动搜索算法的落地与提升; 2、参与搜索算法的优化与迭代,提升转化效率、用户体验和供给生态; 3、深入参与搜索产品的需求设计,负责算法和工程的高质量交付,持续优化效果提升产品体验; 4、挖掘数据,构建Query理解、召回、排序等模型,提升搜索算法能力; 5、学习前沿技术,探索大模型等创新技术在AI搜索场景的落地。