阿里巴巴算法技术-基于多粒度攻防的同源系统升级-多模态算法实习生
任职要求
1. 自然语言处理、机器学习、数据挖掘、人工智能等相关专业的硕士生/博士生; 2. 熟练掌握Tensorflow、Pytorch等深度学习框架,扎实的编程基础,具备独立的算法实现能力; 3. 有MLLM、aigc、检索等实操经验,并且有科研或者项目产出; 4. 良好的逻辑分析能力和数理基础,对算法原理及应用有较深入的理解,在人工智能相关的各类国际顶级会议/期刊中发表过论文者优先。
工作职责
1. 掌握和跟进LLM、MLLM、aigc等前沿技术的发展动态; 2. 结合业务需求,深入研究aigc细节生成技术,构建攻防算法系统; 3. 结合业务需求,探索细粒度多模态表征技术,以及局部检索技术; 4. 结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。
研究方向一:基于时空场景感知的用户全域意图理解 1. 时空动态感知与即时需求捕捉,用户意图受地理位置(如商圈变化)、时间(如节假日/天气)、实时场景(如突发疫情)等多维度动态因素影响。 2. 多模态行为语义对齐与意图蒸馏,用户行为存在显性交互(点击/收藏)与隐性表达(页面停留/滑动速度)的多模态断层,且跨业务场景(到店/到家)行为模式差异显著。 3. 隐私安全的多场景知识融合,到店、到家等业务场景数据隔离导致用户认知碎片化,且需符合数据安全合规要求。 研究方向二:多模态供给理解与动态表征建模 1. 异构供给的统一语义建模,异构供给(商家/商品/服务/内容)的多模态信息融合难题,需解决文本、图像、视频等跨模态语义对齐与联合表征。 2. 实时供给状态感知与动态更新机制,如库存/价格/服务能力等高频变化要素的即时捕捉。 3. 领域知识增强的供给深度理解,构建覆盖本地生活全场景的细粒度知识图谱。 研究方向三:端到端生成式搜索系统的构建与优化 1. 端到端生成搜索架构构建,解决传统搜索系统"召回→粗排→精排→重排"多阶段解耦带来的信息损失问题,建立统一生成框架下的多目标联合优化机制;设计新型生成式排序范式,融合Scaling Law原理实现语义空间与行为空间的联合表征。 2. 生成结果的可控性与可解释性,构建多粒度约束解码机制,将业务规则、供给状态、合规要求等硬约束编码到生成过程中;同时设计基于强化学习的偏好对齐框架,实现生成质量的双重控制。 3. 实时推理性能优化,攻克大模型长序列处理的性能瓶颈,研发基于Attention稀疏化和状态复用的流式生成技术;设计轻量化验证网络,在保证生成质量的前提下将推理延迟降低至毫秒级,支撑亿级DAU场景。
专注与多模态预训练语言模型驱动的视觉搜索模型训练和优化,具体职责包括: 1、探索基于VLM的视觉信息多模态搜索训练数据合成方案; 2、深入优化融合视觉信息搜索能力的模型最优训练策略, 包括弹性维度支持、稀疏表征训练、单向量/多向量压缩等多种方法,旨在构建高效且具备强视觉感知能力的多模态搜索模型; 3、探索面向文本、图像与视频输入的统一视觉信息搜索模型训练, 通过构建跨模态、跨语言及多粒度的统一表示空间,解决不同模态之间语义对齐与表征一致性的问题,实现更加通用和鲁棒的视觉信息搜索能力。
研究方向一:多决策变量联合因果效应建模 该方向建模和评估多维单一干预动作或多干预动作的联合因果效应。关键问题点如下: 1.识别多干预动作、单干预动作多维间是否存在相互作用,并解决高维混杂空间投影问题,量化这些相互作用的影响。 2.解决交叉混杂效应等难题,建立多干预动作、多干预维度的联合分布模型,量化预估共同作用时的联合因果效应。 3.预估用户/群体粒度的多干预动作因果效应,并提供直观解释,帮助决策者理解更好的制定有效策略。 研究方向二:基于强化学习的序列化因果建模和决策 该方向研究特定业务场景下,通过序列化的干预动作设计,实现有限资源下的累积收益最大化。关键问题如下: 1.建立连续决策因果归因能力:准确估计在前置treatment序列下,当前干预动作选择的用户个性化因果效应。 2.基于强化学习的序列化决策:基于因果效应的预估,运用强化学习技术做出本次干预动作的最优化决策;学习干预顺序和时间间隔对结果的影响,优化组合干预策略以达到最佳的结果。 3.延迟因果效应建模:干预动作的影响可能不会立即显现,如何表征延迟效应、建模长程因果传导效应,并基于对未来流量或用户行为的预估,做出前瞻性的决策。 研究方向三:基于LLM的用户意图识别和营销增长机会点发现 该方向研究如何充分利用LLM的序列推理能力,基于用户行为序列实时识别用户意图和营销增长机会点。关键问题如下: 1.潜在意图识别:构建显性→潜在→衍生的意图金字塔模型和多层级attention机制,增强隐式关系捕捉能力,提升意图识别覆盖率。 2.提升意图识别准确率:系统性构建高质量意图数据集,合理应用RAG技术,建设RLHF和对抗性数据增强能力。 3.提升意图可解释性:解决用户表层表达与深层需求间的语义断层,融入因果推理模块、构建反事实注意力机制。 研究方向四:观测样本与RCT样本的消偏融合研究 样本消融研究主要关注如何结合不同来源的数据改善因果推断的准确性和可靠性。关键问题如下: 1.如何识别和消除观测数据中的混淆偏差,如何识别同时影响treatment和结果的混杂因素。 2.如何针对业务场景和数据集特点,选择合适的消偏算法,消除观测数据中的选择偏差和控制RCT数据的归纳偏差。 3.如何有效地融合RCT和观测数据,以利用两者的优势并克服各自的限制,有效降低方差的同时尽可能得到无偏估计。
团队使命: 作为网约车交易市场技术核心团队,我们应用机器学习、运筹优化、因果推断、深度强化学习及生成式AI技术(LLM) ,构建支撑千万级日订单的动态双边市场智能决策系统。通过供需预测建模、动态定价策略、智能补贴分配、生态治理引擎 等策略引擎建设,持续优化平台商业价值与司乘体验,驱动全球领先的出行市场效率革新。 供需调节策略方向的主要工作: - 负责设计研发面向司乘双边市场的动态定价和跨品类联合补贴策略引擎,涉及的技术方向包括:精细化的时空供需预测建模、针对海量数据的细粒度因果建模、大规模运筹优化与求解算法设计、大规模离线仿真系统设计与研发等。 - 负责设计研发面向用户长期增长的智能增长营销策略引擎,构建可持续优化的收益管理与增长引擎系统,涉及的技术方向包括:长周期用户价值(LTV)建模、基于强化学习的序列化决策模型设计、大规模运筹优化与收益管理系统设计等。 - 负责设计研发面向供需调节和用户增长的智能运营系统,构建面向多目标高度封装的全自动智能化的运营引擎,助力网约车业务精细化运营提效。涉及的技术方向包括:不同粒度、周期的时序预测建模、大规模运筹优化求解算法、支持深度人机结合的工业化运营引擎架构。 - 负责设计研发面向网约车交易场景的司乘生态治理引擎,构建面向不同品类业务特点的判责、治理策略系统,涉及技术包括:多模态深度学习建模、大语言模型技术、原子预测和小样本学习等技术。