阿里云研究型实习生 - 多元时序异常检测和下钻分析
任职要求
算法原型:多元时间序列异常检测和下钻分析相关源代码 论文/专利:发表阿里认可的CCF-A/B类或者领域内顶级会议/期刊论文1篇或专利1篇以上。 Benchmark:基于阿里云大数据计算平台的真实数据,构建一套具有代表性的Benchmark Dataset 技术指标: 1)异常检测算法准确率:以Hologres实例异常检测为例,对实例异常判定的准确率比前沿算法模型准确率提高10%以上。 2)下钻分析准确率:在阿里云计算平台当前的成本运营相关下钻分析场景中,主指标的异常判定以及根因子指标的推荐准确率比当前线上版本的准确率提高5%以上。
工作职责
在阿里云大数据智能运维场景中,存在大量时间序列异常检测的需求,涉及成本指标、集群、数据库实例、计算作业等诸多监控场景。 阿里云大数据技术与工程团队在时间序列异常检测方向深耕多年,特别是单指标的异常检测方面,支撑了集团内和公有云多个重要的场景。包括(1)Dataworks提供数据质量监控(DQC)动态阈值能力,自动监控集团内部和公有云Dataworks用户的数据表质量;(2)为Flink提供作业延迟的自动监控,实现海量作业异常的自动捕捉,帮助SRE及时发现大规模用户问题并确定影响面等。 但我们发现在只能运维复杂场景下精准的时序异常检测依然存在诸多技术挑战。例如(1)Hologres的实例异常发现,常常需要联合多个数据库性能相关指标综合判断,单指标的异常检测无法做出准确决策。(2)在包含主指标与子指标的下钻场景中,如大数据平台整体资源使用率和各产品资源使用率。在主指标出现异常时,还期望能够准确定位到对异常贡献度最大的子指标。 因此,团队计划在自研算法同时,通过RI项目引入高校优秀学生资源提高团队竞争力,同时也为未来招聘提供优秀候选人。
研究领域: 人工智能 项目简介: 在大型语言模型的发展中,内外部透出的大模型在各项能力上参差不齐。同时,LLMs庞大的计算量和资源需求限制了它们的实用性,尤其是在计算资源受限的环境中。知识蒸馏作为一种将大型教师模型的知识转移至体更灵活(甚至体积更小)的学生模型的技术,展现出巨大的潜力。然而,目前大部分研究集中于单个教师模型的知识转移,而忽略了不同教师模型可能提供的多样化和互补性知识。本项目动机是探索如何从多个多样化的大型语言教师模型中蒸馏知识,以此来丰富和增强学生模型的在某个场景(比如代码)下的各种细分能力,同时学生模型可以通过对经典attention结构的战略性增强,在细分领域上超过LLM。
阿里妈妈-智能广告平台团队负责阿里妈妈核心广告产品的广告主投放效果优化、广告产技能力创新和客户增长。我们通过挖掘广告主多元需求,引导商家合理投放广告,带动平台广告主数量和预算增长。技术上,我们利用机器学习、深度学习、大模型应用、因果推断等多种技术带动业务持续增长。 我们团队具有扎实的学术研究能⼒和业务落地能⼒。学术成果⽅⾯,我们在NeuraIPS、KDD、WWW、WSDM等国际⾼⽔平会议上发表学术论⽂⼗余篇,提出多个新的研究⽅向上和技术⽅案并得到了⼯业界和学术界的⼴泛关注和跟进。 1. 参与和跟进Uplift建模相关算法研究,结合因果推断、深度学习、强化学习等技术,提高模型性能; 2. 设计高效算法解决实际业务中的多目标优化问题,提升用户体验和平台收入; 3. 与算法工程师、数据科学家协作完成模型开发、实验验证,将研究应用到实际业务当中; 4. 推动研究成果落地,撰写高质量论文并发表,支持团队核心技术竞争力建设。
阿里妈妈-智能广告平台团队负责阿里妈妈核心广告产品的广告主投放效果优化、广告产技能力创新和客户增长。我们通过挖掘广告主多元需求,升级智能投放能力提升投放效果,带动广告预算增长。技术上,我们通过基于大模型、生成算法、强化学习的出价Agent对智能出价系统进行深度优化。 我们在智能出价领域有丰厚的技术底蕴,在NeurIPS、KDD、WWW等国际高水平会议上发表学术论文,并通过技术创新显著提升业务效果。决策智能技术是人工智能的关键研究领域,在大型博弈环境中有广泛应用,例如在线广告、金融市场、电子商务和能源交易。在线广告是典型的大型博弈场景,随着生成算法在广告决策领域的初步成功应用,我们相信决策领域的大模型蕴藏着巨大潜力和广阔的技术探索空间。 具体职责: 1. 深入运用生成算法(如Diffusion、Transformer等)对出价决策模型进行探索与迭代。 2. 探索大模型(LLM)与出价决策模型的融合方案,包括但不限于特征增强、环境建模、端到端决策等。 3. 跟进业界前沿技术趋势,开展前沿算法的研究工作,撰写发表论文。结合实际业务需求,将技术应用到实际业务场景。 加入我们,您将获得: 1. 贴近工业实践的技术挑战,享有丰富的数据资源和强大的计算支持。 2. 深度参与研发团队内部研讨,与顶尖专家共同探讨前沿技术,合作发表国际顶级会议论文。 3. 一对一的行业专家指导,助力业界领先并具有巨大影响力的工作。 4. 可观的实习薪酬以及校招人才计划的绿色通道。
AI大模型为代表的算力需求增长对数据中心的能源使用、计算资源成本和碳排放提出了多重挑战。研究成本和碳排感知的云计算数据中心相关创新技术,促进算电协同转化,提升计算资源利用效率,降低计算任务调度成本,增强绿色低碳水平,对于达成普惠易用、绿色安全AI大模型算力需求意义重大。本项目将主要围绕以下四个方面开展研究: (1)云计算“算力-电力”协同调度研究:研究适配不同算力业务类别、不同计算资源配置的弹性用能多元感知及耦合优化技术; (2)云计算综合用能管理技术研究:“源网荷储“新型算力基础设施规划、运行和灵活调控技术; (3)云计算运营成本优化技术研究:聚焦能源/碳排交易市场,开展云计算成本优化; (4)低能耗大语言模型技术研究:多元感知的大语言模型算力成本优化。 目标围绕以上单个或多个目标开展研究工作,发表不少于1篇领域内认可的期刊或会议论文(CCF-A类),或沉淀可指导实际场景应用的算法代码和策略模块。