阿里巴巴AI原生应用-多模态大模型算法专家-杭州
任职要求
1、2年以上多模态或计算机视觉相关经验;有第一梯队大模型研发团队经历、CCF-A 类会议论文发表、或电商/零售行业落地经验者优先; 2、代码级熟悉VL开源生态,对网络架构、训练框架或推理优化至少一个方向有深入掌握; 3、具备大模型预训练或后训练完整实操经验;具备各阶段/多任务相互配合以及折中权衡等决策能力; 4、具备亿级别以上样本的查询、处理、调度等工程技巧;具备从数据和评测角度进行溯源和归因的能力; 5、 在真实业务场景中实现过外推泛化案例者优先。
工作职责
1. 负责多模态大模型的核心技术攻坚和效果优化,基于平台垂直领域专业知识积累,面向百亿级商品实现结构化和细颗粒度的视觉理解能力,推动生成模型在效果和控制力上实现业界领先; 2. 借助大模型和大数据洞察能力,帮助服饰快时尚行业搭建从企划、设计、商详到孵化的全链路AI Agent解决方案,为行业带来新的商业模式和增长点。
1、负责包括图像/视频在内的多模态大模型应用算法研发工作,探索多模态推理智能上限,提升基础视觉理解能力; 2、负责多模态大模型的高效微调、偏好对齐和推理增强技术,确保大模型在业务场景中的快速适配和高效调用; 3、支持AI原生产品的研发需求,面向用户探索视觉原生交互形态,设计/创新合理技术方案。
1、研发面向云计算底座海量数据的大模型,包括但不限于代码大模型、全模态、大规模图学习等领域相关的大模型的应用算法研发; 2、参与大模型应用研发全流程的工作,包括但不限于模型算法设计、代码开发、训练、部署优化、调试、评测;技术创新如专利、论文的撰写;外部技术影响力交流等; 3、推动大模型在DevOps提效、内外部智能体业务应用、爆款AI原生应用、安全和技术风险防控等场景的业务落地;
1、负责探索视觉原生交互中的多模态应用算法方向,包括传统视觉中的检测跟踪识别算法以及多模态大模型端云结合部署应用中的推理优化和高性能计算技术,提升AI原生产品的用户交互体验; 2、探索大模型/多模态大模型的模型轻量化、软硬结合、推理加速以及面向大规模应用的引擎部署等工作内容。
关于我们: AI Business 成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于大模型技术能力建设和 AI 原生应用和产品的打造,旨在用最先进的 AI 技术重塑平台竞争力,为商家和用户带来极致电商体验。 作为跨境电商领域的 AI 先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对 AI 领域人才的培养和发展。我们已经汇聚了业内顶尖的 AI 算法专家、AI 工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的 AI 人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 职位描述: 1、负责多语言大语言模型(LLM)的预训练、微调及优化,探索高效训练策略(如低资源语种能力迁移、任务调度优化等),提升模型性能与跨文化场景适应性; 2、构建多模态大模型技术体系,包括图文生成、视频内容生成、多模态检索与信息抽取,支持商品虚拟试穿、智能客服等业务场景。 3、推动大模型与业务深度融合,开发基于LLM的对话系统、Agent产品及RAG系统,优化电商文本生成、跨语言信息匹配、时间序列预测等场景的智能决策能力; 4、设计强化学习对齐算法(如RLHF/DPO),提升模型在垂直领域(如商品推荐、用户交互)的精准度与可控性。 4、实现大模型的高效推理部署,包括模型压缩量化、GPU并行计算优化(如CUDA加速),确保高并发场景下的服务稳定性; 5、探索生成式AI与电商场景结合的前沿技术(如AIGC内容生成、多模态商品检索),推动技术规模化落地。