阿里巴巴阿里国际站/Alibaba.com-多模态大模型搜索算法专家-Accio-杭州
任职要求
1. 计算机科学、人工智能、数学或统计学等相关专业硕士及以上学历,有多模态大模型相关研究或实际项目经验者优先。 2. 熟悉搜索引擎的基本原理和算法,包括query理解、召回、相关性排序、个性化推荐等,有多模态搜索和图搜经验者优先。 3. 深入理解GPT-4o/Qwen-VL/InternVL等 MLLM模型,具备大模型post-train…
工作职责
我们是阿里巴巴国际数字商业集团-阿里巴巴国际站-Accio算法团队。阿里巴巴国际站是全球最大的跨境B2B数字化贸易平台。 1. 负责开发和优化新一代多模态AI搜索系统,包括但不限于多模态模型训练、跨模态生成与检索、多模态Agent等。 2. 负责搜索系统算法设计与实施,负责搜索系统中的多模态query理解、召回、相关性排序等关键模块的算法设计与优化。 3. 跟踪多模态大模型方向前沿问题的研究,将业界SOTA模型在业务场景进行产品化落地。
我们是阿里国际-Accio算法团队。Accio是阿里巴巴集团的战略级AI原生应用产品,也是全球首个B2B AI Search Agent,我们通过持续探索Agent、LLM、VLM、RL、Reasoning、AI Search等前沿技术,自研基座、Agent系统以及AI Search系统,驱动实现全球B2B电商贸易业务跨越式发展。 职位描述: 1. 负责开发和优化AI原生的全网搜索系统,包括但不限于文本和多模态模型训练、跨模态生成与检索、生成式搜索技术等; 2. 负责搜索系统算法设计与实施,负责搜索系统中的query理解、召回、相关性、排序等关键模块的算法设计与优化; 3. 负责全网商家/商品的Deep Research、全网询盘Agent链路的设计、实现和优化,负责将业界的SOTA Agent模型在业务场景中落地。
在LLM重构搜索的浪潮中,数据质量决定模型智能的天花板。我们需要你构建数据与模型的「双向进化引擎」,从万亿级多模态数据中提炼认知黄金,驱动大模型突破搜索理解的终极边界! 1. 万亿级网页提炼:研发多模态数据分析框架,通过网页解析、文档智能、知识抽取等技术,完成全网万亿级搜索网页的关键信息提炼。 2. 攻克数据质量理解:设计网页质量/权威性/可信度的多维度评估模型,以及跨模态数据表征技术,提升夸克在网页知识获取的准确性与可靠性。 3. 驱动数据与算法协同进化:探索大模型时代的数据评估方法论,量化数据优化对搜索效果和模型性能的影响。 4. 打造全网优质内容库:构建多模态数据的处理和挑选管线,建立覆盖网页/图文/视频等全域内容的智能知识库。
● 作为多模态搜索算法团队的负责人,主导构建全球领先的AI驱动跨境B2B搜索引擎,帮助全球买家高效寻找优质制造工厂。 ● 带领团队攻克复杂采购需求的理解难题,支持用户通过图像、图文、Excel表格、PDF文档等多模态输入方式表达采购意图,实现端到端智能解析与语义理解。 ● 设计并落地先进的多模态融合架构,结合视觉、语言与结构化数据理解技术,提升对产品规格、工艺要求、批量参数等关键信息的精准提取能力。 ● 构建高精度、可扩展的搜索引擎匹配系统,融合语义推理、知识构建与向量检索技术,实现“所想即所得”的智能搜索体验。 ● 与产品、工程及业务团队深度协作,洞察业务需求,定义合理的技术路线图,推动技术创新与产品落地。