logo of aliyun

阿里云研究型实习生 - 成本和碳排感知的AI驱动绿色云计算

实习兼职阿里云研究型实习生地点:北京 | 杭州状态:招聘

任职要求


计算机大类、电气工程类、经管类相关专业背景,25/26/27/28应届博士/硕士研究生,具有良好的算法实操能力和科研素养,有相关领域论文发表经历优先。

工作职责


AI大模型为代表的算力需求增长对数据中心的能源使用、计算资源成本和碳排放提出了多重挑战。研究成本和碳排感知的云计算数据中心相关创新技术,促进算电协同转化,提升计算资源利用效率,降低计算任务调度成本,增强绿色低碳水平,对于达成普惠易用、绿色安全AI大模型算力需求意义重大。本项目将主要围绕以下四个方面开展研究:
(1)云计算“算力-电力”协同调度研究:研究适配不同算力业务类别、不同计算资源配置的弹性用能多元感知及耦合优化技术;
(2)云计算综合用能管理技术研究:“源网荷储“新型算力基础设施规划、运行和灵活调控技术;
(3)云计算运营成本优化技术研究:聚焦能源/碳排交易市场,开展云计算成本优化;
(4)低能耗大语言模型技术研究:多元感知的大语言模型算力成本优化。
目标围绕以上单个或多个目标开展研究工作,发表不少于1篇领域内认可的期刊或会议论文(CCF-A类),或沉淀可指导实际场景应用的算法代码和策略模块。
包括英文材料
算法+
相关职位

logo of aliyun
实习阿里云研究型实习

Tair是基于云原生基础设施的KV数据库产品。在技术上期望通过云的规模化效应,基于云基础设施,面向海量的各种规模的客户提供更低的成本和更好的弹性。从工程实践和业务分析上看到对比当前主流的单租户架构模式,多租户的架构聚合度提升带来的成本优化能极大的提升云数据库的竞争力,但同时在租户影响上面对的挑战也比较大。 基于以上背景,本项目期望聚焦如下技术问题的研究: 1.优化KV存储引擎在复杂流量场景和多租户场景的延迟表现; 2.KV存储引擎在多租户场景下的资源隔离、限流相关技术研究; 3.研发多租的分布式KV集群如何在提升弹性的同时能更高效的利用资源。

更新于 2025-07-02
logo of aliyun
实习阿里云研究型实习

专注于Anycast系统的开发、设计和调优,具体职责包括: 1.基于机器学习的数据流量优化问题:利用机器学习技术分析和预测网络流量模式,从而优化数据在Anycast网络中的传输路径,提高网络的整体效率和鲁棒性。 2.基于机器学习的流量路由策略(learning to route):使用机器学习模型动态调整流量路由策略,减少网络拥堵,提高数据包传输的成功率和速度。 3.基于机器学习的故障检测与恢复(learning to detect and recover):开发机器学习算法实时监控Anycast网络中的节点和链路状态,及时检测异常并自动触发恢复机制,以保证服务的连续性和稳定性。 4.基于机器学习的资源分配(learning to allocate resources):根据实时的网络负载和用户请求特点,动态调整服务器和网络资源的分配策略,以优化Anycast服务的性能和成本。 5.基于机器学习的网络安全策略(learning to secure):利用机器学习算法识别并防御潜在的网络攻击和安全威胁,增强Anycast网络的安全性和可靠性。

更新于 2025-03-03
logo of aliyun
实习阿里云研究型实习

本项目主要关注大语言模型的部署环节,以解决大语言模型推理框架中的如下技术问题: 1. 优化单服务实例的性能和成本:配合前沿模型压缩算法探索高性能算子的前沿方向、创新注意力算子(Attention)实现方式、通过编译优化等手段提升模型推理性能;结合大语言模型服务的场景特性,创新请求调度算法,优化用户体验和系统吞吐;结合算法创新,采用上下文稀疏、投机采样等方法加速解码(Decoding)过程。 2. 异构硬件适配:以编译技术为基础,探索统一的跨平台优化方法,能敏捷地完成主流的GPU/CPU/NPU等硬件的适配,并在各个平台提供较高的性能。 3. 探索云上单租户多服务、多租场景下的混合部署方法,将不同尺寸、不同访问频度、不同优先级的模型混合部署在异构资源池中,并保证SLA。通过请求调度方法的创新、资源共享方法创新,降低总体部署成本、提升资源利用率和弹性。

更新于 2024-07-12
logo of aliyun
实习阿里云研究型实习

1、负责研究AI大模型的推理性能优化算法,优化大模型推理部署的算力和访存瓶颈,提升AI模型在GPU、AI加速器等硬件上部署性能效率,推动大模型普惠应用和高性价比的竞争力; 2、负责高性能软硬结合的大模型推理优化方法研究,在AI类业务场景尤其是大模型场景下,通过结合模型算法和硬件来充分挖掘软硬件协同的组合优化潜力,带来高价值的性能和成本优势; 3、负责研发业界SOTA的多模态大模型计算性能优化方法创新,增强技术壁垒,并在云的商业业务中产生核心价值。

更新于 2025-10-14