阿里巴巴AI原生应用-多模态大模型算法专家-杭州
任职要求
1、2年以上多模态或计算机视觉相关经验;有第一梯队大模型研发团队经历、CCF-A 类会议论文发表、或电商/零售行业落地经验者优先; 2、代码级熟悉VL开源生态,对网络架构、训练框架或推理优化至少一个方向有深入掌握; 3、具备大…
工作职责
1. 负责多模态大模型的核心技术攻坚和效果优化,基于平台垂直领域专业知识积累,面向百亿级商品实现结构化和细颗粒度的视觉理解能力,推动生成模型在效果和控制力上实现业界领先; 2. 借助大模型和大数据洞察能力,帮助服饰快时尚行业搭建从企划、设计、商详到孵化的全链路AI Agent解决方案,为行业带来新的商业模式和增长点。
Accio是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品,也是全球首个B2B AI Search Agent,通过持续探索Agent、LLM、VLM、RL、Memory、Reasoning、AI Search等前沿技术,自研基座、Agent系统以及AI Search系统,实现全球B2B跨境贸易跨越式发展。 1、参与开发和优化新一代多模态原生AI搜索系统,包括但不限于多模态模型训练、跨模态生成与检索、生成式AI搜、多模态Agent等; 2、参与搜索引擎研发,全链路提升搜索效果,包括但不限于多模态理解、query分析、召回、相关性、排序等关键模块的算法设计与优化; 3、参与买家Agent全链路开发与优化,跟踪前沿多模态大模型技术,探索推动开源SOTA模型的产品化落地。
我们是阿里国际-Accio算法团队。Accio是阿里巴巴集团的战略级AI原生应用产品,也是全球首个B2B AI Search Agent,我们通过持续探索Agent、LLM、VLM、RL、Reasoning、AI Search等前沿技术,自研基座、Agent系统以及AI Search系统,驱动实现全球B2B电商贸易业务跨越式发展。 职位描述: 1. 负责开发和优化AI原生的全网搜索系统,包括但不限于文本和多模态模型训练、跨模态生成与检索、生成式搜索技术等; 2. 负责搜索系统算法设计与实施,负责搜索系统中的query理解、召回、相关性、排序等关键模块的算法设计与优化; 3. 负责全网商家/商品的Deep Research、全网询盘Agent链路的设计、实现和优化,负责将业界的SOTA Agent模型在业务场景中落地。
【职位描述】: 1、负责AI产品开发与应用:围绕外贸商品构建B类商品模型、AI发品、负向治理等能力; 2、技术能力:电商领域多模态大模型,包括从监督微调(SFT)到强化学习人类反馈(RLHF)的全链路技术构建,以及智能Agent系统,涵盖但不限于检索增强生成(RAG)系统、Agent系统和工作流推理等。 3、推动跨境电商AI创新业务的落地实施,包括高效的商品AI大模型、AI发品和诊断Agent等解决方案。 4、开展前沿LLM技术的探索,持续迭代和优化自研模型能力,以支持AI原生产品的实施。
● 设计和实现高效的训练推理框架,提升多节点、多GPU环境下特别是异构算力场景下的计算效率。具备良好的工程实践和算法理论基础,熟悉底层的硬件编程和常见GPU的算子库开发,能对算法的运行效率如速度、显存占用等进行优化,推动算法稳定、高效的运行。 ● 完善优化训练推理框架,针对市面上的国产信创卡能提出统一的优化方案,并推进在底层的通信效率、资源占用、稳定性方面持续建设。 ● 设计并实现能够处理大规模并发请求的系统架构,确保极端负载下的稳定性和性能。完善错误自愈机制,提升平台训练的MFU,打造行业内一流的异构算力混训混推GPU框架。 ● 技术方案设计:主导核心模块技术方案设计与评审,结合业务需求与系统现状,制定可落地的架构规划。 ● 基础服务开发:构建高可用、可扩展的基础服务组件,支持训练/推理框架的快速迭代与稳定部署。 ● 项目管理:主导跨团队协作项目的全生命周期管理,包括需求拆解、排期规划、进度跟踪与风险控制,确保项目高效交付。 ● 持续关注并跟进业界技术发展,比如超长上下文、端到端推理思维链、多模态等方向。