阿里巴巴阿里国际站/Alibaba.com-搜索算法专家-杭州
任职要求
职位要求: 1、具备扎实的数据结构、机器学习和code的能力,熟练使用python、c++编程语言。 2、算法基础扎实,持续跟进学术、工业界大模型的进展,并对大模型有浓厚兴趣,此外在传统方向上:或者跟进文文大模型、多模态、强化学习等领域的前沿算法。 3、有良好的逻辑分析、问题解决的能力,对数据敏感度高,具备优秀的学习以及团队协作能力。有搜推广、大模型经验的更佳。 4、有国际顶会发表过论文的优先。
工作职责
搜索匹配算法&大模型算法 业务描述: 1、我们所在的组是为全球最大的B2B电商-alibaba.com搜索算法业务服务,致力打造全球顶级的搜索引擎,为全球200多国家的买家提供多语言搜索搜索匹配能力。 2、整个搜索全面转向大模型,升级文文匹配、多模态匹配的精准性,深化用户意图识别、打造英语、多言语言深度语义一流技术,并进行产品创新,实习智能问答,应用技术包括:RAG、强化学习、Agent、对话等等。 3、为搜索全链路(召回、粗排、相关性、精排、重排、增长&留存)效能不断提升进行优化。利用全球化、多文化的海量用户数据,对用户的诉求进行极致识别,促进业务目标的转化。 4、针对多国家、多语言用户带来的query长尾偏多,行为稀疏、不均衡问题,进行深度探索,更好理解用户的真实意图,让多样的货品与不同用户/群体,实现连接。
“我们正在引领搜索技术的下一代革命,致力于通过大模型重构电商搜索与推荐的核心链路”。团队聚焦生成式召回、多模态理解、语义大模型 等前沿方向,打造“千人千面”的极致个性化体验,并推动语义理解与个性化召回的深度融合。如果你渴望用大模型重新定义亿万用户的购物体验,这里将是你的理想战场! 1.主导大模型在搜索场景的落地与创新,设计生成式召回策略 、多模态语义理解模型 及个性化排序算法 ,提升搜索结果的相关性与多样性; 2.探索大模型在用户意图理解、商品知识挖掘中的应用,构建端到端的语义搜索系统,解决长尾查询与跨模态匹配的技术难题; 3.驱动多模态交互创新,实现文本、图像融合的智能搜索体验,并探索AI Agent在购物场景中的主动服务模式。
1. 负责智能信息事业群下的医疗搜索的核心算法研发,涉及到大模型排序、数据挖掘、机器学习、召回排序以及自然语言理解等技术问题; 2. 结合大模型能力,在搜索领域进行大模型应用和落地,对大模型训练和学习,通过大模型优化相关性、召回和排序提升搜索排序效果; 3. 需要对海量全网数据(文本、图片、视频等)和超大规模用户行为进行深度挖掘,并阅读最新的论文文献,优化统计学习和深度学习模型,极致提升用户在夸克医疗搜索的产品体验; 4. 在线学习等方法进行用户行为分析,深度解决用户的痛点。
在LLM重构搜索的浪潮中,数据质量决定模型智能的天花板。我们需要你构建数据与模型的「双向进化引擎」,从万亿级多模态数据中提炼认知黄金,驱动大模型突破搜索理解的终极边界! 1. 万亿级网页提炼:研发多模态数据分析框架,通过网页解析、文档智能、知识抽取等技术,完成全网万亿级搜索网页的关键信息提炼。 2. 攻克数据质量理解:设计网页质量/权威性/可信度的多维度评估模型,以及跨模态数据表征技术,提升夸克在网页知识获取的准确性与可靠性。 3. 驱动数据与算法协同进化:探索大模型时代的数据评估方法论,量化数据优化对搜索效果和模型性能的影响。 4. 打造全网优质内容库:构建多模态数据的处理和挑选管线,建立覆盖网页/图文/视频等全域内容的智能知识库。