阿里巴巴阿里国际站-高级多模态算法专家-多模态搜索算法
任职要求
● 计算机科学、人工智能或相关专业硕士及以上学历,5年以上算法研发经验,至少2年带领AI算法团队的经验,有成功交付大型搜索或推荐系统项目经历者优先。 ● 在多模态大模型领域有深厚积累,主导或深度参与过多模态大模型(如图文理解、文档智能、视觉-语言模型)的训练工作。 ● 熟悉主流多模态架构(如CLIP、BLIP、Qwen-VL、LLaVA等),掌握跨模态对齐、对比学习、MoE架构等关键技术,并有实际调优经验。 ● (优先)具备将多模态大模型应用于搜索系统的实战经验,例如用于query理解、向量召回、重排序(reranking)等环节,显著提升搜索体验。 ● 具备强烈的技术前瞻性与产品思维,能够将前沿AI研究成果转化为可落地、可度量的业务价值,推动技术壁垒构建。
工作职责
● 作为多模态搜索算法团队的负责人,主导构建全球领先的AI驱动跨境B2B搜索引擎,帮助全球买家高效寻找优质制造工厂。 ● 带领团队攻克复杂采购需求的理解难题,支持用户通过图像、图文、Excel表格、PDF文档等多模态输入方式表达采购意图,实现端到端智能解析与语义理解。 ● 设计并落地先进的多模态融合架构,结合视觉、语言与结构化数据理解技术,提升对产品规格、工艺要求、批量参数等关键信息的精准提取能力。 ● 构建高精度、可扩展的搜索引擎匹配系统,融合语义推理、知识构建与向量检索技术,实现“所想即所得”的智能搜索体验。 ● 与产品、工程及业务团队深度协作,洞察业务需求,定义合理的技术路线图,推动技术创新与产品落地。
1.负责点评平台搜索体验优化,包括查询理解、相关性、排序、知识挖掘等核心工作,不断优化搜索用户体验,驱动业务规模增长; 2.深度研究搜索领域内的前沿算法技术,包括但不限于使用大模型、BERT、Transformer、多目标、多模态等技术迭代创新并落地到业务中; 3.和产品、运营等团队紧密合作,根据业务需求进行数据分析和模型优化,提供高效的、符合用户需求的搜索体验; 4.解决生产环境中的问题和异常,保障搜索服务的稳定运行。
岗位描述: 1. 负责点评平台搜索体验优化,包括查询理解、相关性、排序、知识挖掘等核心工作,不断优化搜索用户体验,驱动业务规模增长; 2. 深度研究搜索领域内的前沿算法技术,包括但不限于使用大模型、BERT、Transformer、多目标、多模态等技术迭代创新并落地到业务中; 3. 和产品、运营等团队紧密合作,根据业务需求进行数据分析和模型优化,提供高效的、符合用户需求的搜索体验; 4. 解决生产环境中的问题和异常,保障搜索服务的稳定运行。
团队介绍:字节跳动抖音搜索团队主要负责抖音搜索算法创新和架构研发工作,主要包括短视频、直播、本地生活、视觉搜索等多个业务线。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 1、参与抖音,今日头条,西瓜视频,剪映等App,以及国内电商,生活服务等重点业务的搜索推荐模型和策略改进,负责这些业务的搜索流量和用户渗透增长&搜索心智建设任务; 2、以推荐算法为核心技术栈,改进基于超大规模机器学习模型的推荐系统,覆盖从候选挖掘到召回,粗排,精排,多目标融合全链路技术环节; 3、探索短文本推荐和通用推荐技术的上限,重点是推荐和NLP技术的联合应用,以及多模态等前沿技术的探索。
AE搜索算法团队,负责AIDC AliExpress(AE)、JP- AO和天猫淘宝海外等国际化电商搜索业务优化,为全球100多个国家使用不用语言的用户持续电商搜索体验与效率,并结合大模型升级技术与产品体验创新。 多年来团队紧跟工业界和学术界前沿,在多语言Query理解与相关性、国家差异化召回与排序模型、多语言Query导购与大模型在多语言搜索中应用等技术方向持续探索创新,带来业务快速增长同时发表⾼⽔平学术论⽂20+篇(如AAAI、 IJCAI、TKDE、TMM、RecSys、CIKM和ICDM),申请专利15+项。 大规模深度模型的搜索算法研究,包括但不限于: 1. 多语言Query理解、商品理解和相关性,包括:Query和商品NER、Query类目预测、Query改写与扩展、多语言&跨语言语义相关性等;LLM在多语言电商搜索领域应用,包括:大模型CT和SFT,以及在Query理解、语义相关性、商品理解上的应用; 2. 个性化召回与排序相关技术:基于大规模深度模型的CTR/CVR预估模型及个性化召回模型,包括用户行为序列建模、多目标建模、多模态跨场景迁移建模、国家差异化建模体系建设等; 3. 个性化多语言Query推荐,包括:下拉、底纹、风向标等场域,基于异构行为序列建模、多场景建模的多语言Query推荐技术研究与应用;