阿里巴巴阿里国际站-高级多模态算法专家-多模态搜索算法
任职要求
● 计算机科学、人工智能或相关专业硕士及以上学历,5年以上算法研发经验,至少2年带领AI算法团队的经验,有成功交付大型搜索或推荐系统项目经历者优先。 ● 在多模态大模型领域有深厚积累,主导或深度参与过多模态大模型(如图文理解、文档智能、视觉-语言模型)的训练工作。 ● 熟悉主流多模态架构(如CLIP、BLIP、Qwen-VL、LL…
工作职责
● 作为多模态搜索算法团队的负责人,主导构建全球领先的AI驱动跨境B2B搜索引擎,帮助全球买家高效寻找优质制造工厂。 ● 带领团队攻克复杂采购需求的理解难题,支持用户通过图像、图文、Excel表格、PDF文档等多模态输入方式表达采购意图,实现端到端智能解析与语义理解。 ● 设计并落地先进的多模态融合架构,结合视觉、语言与结构化数据理解技术,提升对产品规格、工艺要求、批量参数等关键信息的精准提取能力。 ● 构建高精度、可扩展的搜索引擎匹配系统,融合语义推理、知识构建与向量检索技术,实现“所想即所得”的智能搜索体验。 ● 与产品、工程及业务团队深度协作,洞察业务需求,定义合理的技术路线图,推动技术创新与产品落地。
【为什么加入我们】 ● 我们是谁:阿里国际数字商业集团下Alibaba.com公司(简称阿里国际站),目前为全球最大的在线跨境B2B贸易平台。 ● 真实的复杂场景: 区别于简单的对话,B2B 贸易涉及高客单价、长决策链路(20+ 节点)及深度供应商研究,是 Agentic Workflow 落地最具价值的试验田。 ● 顶尖科研环境: 团队成员来自国内外名校,拥有硅谷 Office 协同,支持前沿算法探索。 ● 充足算力支持: 自有国内外机房,GPU 资源充足,拒绝“无米之炊”。 【岗位职责】 作为核心算法专家及团队负责人,你将主导 AI 搜索与 Agent 体系的架构演进: 1. Agent 架构设计: 负责 B2B 买家 Agent 的核心引擎开发,包括但不限于 Planning(任务规划)、Long-term Memory(长期记忆)、Tool-use(工具调用)及 Reflection(自我反思) 等模块。 2. 下一代搜索系统: 构建多轮交互下的多模态搜索意图理解。针对超长图文、PDF 采购文件等复杂私有知识,设计高性能的 RAG(检索增强生成)与多模态匹配系统。 3. 算法团队管理: 带领算法团队进行技术攻关,负责从 0 到 1 的算法落地与迭代,建立高效的团队协作与技术梯队。 4. 业务洞察与驱动: 利用 AI 分析海量用户行为,挖掘跨境贸易中的低效环节,通过算法创新定义新的产品形态(AI-Native)。
阿里云AI搜索算法团队致力于构建大模型驱动的AI搜索算法,为多行业客户提供标准搜索产品。团队坚持探索最新技术方向,鼓励创新,拥抱开源生态,相关开源模型及方案登顶多个AI搜索相关公开榜单。您负责的技术方向包括但不限于: 1. 文本搜索:负责长文档搜索相关技术方向,基于LLM全面提升相关文本搜索模块效果,包括Query理解、Embedding及Rerank模型等模块。 2. 多模态搜索:负责图文、视频、语音等多模态数据的相关算法模块,基于VLM实现精准的多模态及跨模态数据检索,包括多模态数据理解、Embedding及Rerank模型等模块。
方向一:搜推效率、生成式、店品券 岗位职责: 1、负责搜索/推荐业务的召回、粗排/精排算法设计和优化,提升大盘转化效率; 2、负责用户、商户、query、营销信号等各维度特征、模型样本等基础模块的搭建和优化; 3、应用机器学习/深度学习、生成式推荐等算法技术,优化召回/排序模型,推动生成式推荐算法的工业落地; 4、与上下游的数据、工程、产品等团队紧密配合,把算法模型等上线到业务场景中,提升业务效果; 5、跟进推荐系统前沿研究方向,结合业务场景进行创新与落地,做技术沉淀和paper发表。 方向二:大混排(统一混排)、全站推 岗位职责: 1、负责混排(信息流+商业化)算法的设计和优化,提升流量变现效率和用户体验; 2、建立并优化目标函数,通过混排多目标优化平衡用户体验 & 平台收益; 3、结合用户画像、内容特征、广告属性等多维度信号,构建高效的特征工程与模型; 4、应用深度学习、强化学习等技术优化推荐与广告混排效果; 5、与工程、产品、运营团队密切协作,将算法落地到生产环境,并持续监控与优化效果; 6、跟踪前沿的推荐与广告算法研究,推动新技术在业务中的应用。
团队介绍 AE搜索算法团队,负责AIDC AliExpress(AE)、JP- AO和天猫淘宝海外等国际化电商搜索业务优化,为全球100多个国家使用不用语言的用户持续电商搜索体验与效率,并结合大模型升级技术与产品体验创新。 多年来团队紧跟工业界和学术界前沿,在多语言Query理解与相关性、国家差异化召回与排序模型、多语言Query导购与大模型在多语言搜索中应用等技术方向持续探索创新,带来业务快速增长同时发表⾼⽔平学术论⽂20+篇(如AAAI、 IJCAI、TKDE、TMM、RecSys、CIKM和ICDM),申请专利15+项。 职位描述 1. 多语言 Query 理解、商品理解和相关性,包括:Query和商品NER、Query类目预测、Query改写与扩展、多语言&跨语言语义相关性等;LLM在多语言电商搜索领域应用,包括:大模型 CT 和 SFT,以及在Query理解、语义相关性、商品理解上的应用; 2. 个性化召回与排序相关技术:基于大规模深度模型的CTR/CVR预估模型及个性化召回模型,包括用户行为序列建模、多目标建模、多模态跨场景迁移建模、国家差异化建模体系建设等; 3. 个性化多语言Query推荐,包括:下拉、底纹、风向标等场域,基于异构行为序列建模、多场景建模的多语言Query推荐技术研究与应用;