阿里云研究型实习生 - 多时间尺度的智能化数据库性能调优
任职要求
1、针对PolarDB实现的原型系统及源码; 2、相关技术…
工作职责
发现数据库系统的性能瓶颈并作出针对性优化是一项重要工作。随着各类智能算法的发展和应用,学术界和业界也逐渐开始利用智能算法优化数据库系统中的各种模块,我们也考虑在实际产品中实现智能化数据库调优能力,项目内容包括但不局限于: 1、数据库可观察性接口:云原生数据库系统含有多种资源,针对性能问题实现系统可观测接口,数据收集与清洗; 2、数据库可操控性接口:定量化数据库系统对外提供的可操控接口特性; 3、多时间尺度的数据库性能分析模型:需要将已有的系统可观察性和可操控性模型化、定量化,建立多时间尺度的系统状态评估模型和状态迁移模型; 4、具有特征性的数据库性能调优算法:基于已有的可观、可控接口及数据库性能模型,设计并实现用于智能化自适应的数据库性能调优算法。
研究领域: 人工智能 项目简介: 近年来,大语言模型和多模态大模型的迅速发展解锁了众多应用场景,包括视觉指令跟随和长视频理解,最近的一些开源方法也已经在提升流式视频处理能力方面有所进展,但它们在交互流畅性和感知能力方面仍然存在不足。本项目旨在对流式视频理解和交互方向加大投入,在多模态大模型视觉内容理解、动态变化跟踪和精确时间对齐等方面进行算法创新,并尝试挖掘其对视频交互中风险动作和风险对话的识别能力,为依赖视频交互能力的各业务场景带来新的突破。
希望解决如下技术问题。 1、适用于商品视频生成的文本-视频数据集:构建一个能够支持基于多模态大模型的商品视频生成算法训练和优化的文本-视频数据集 2. 基于多模态大模型的商品视频生成系统:通过探索基于多模态大模型的文本到视频生成技术,以“视频关键帧-高帧率视频-高分辨率视频”为基本路径,完成文本到视频关键帧生成模型、视频插帧模型、视频超分辨率生成模型等核心算法模型,构建视频生成系统,实现输入商品描述文本+商品图片,自动生成原生化的商品微视频和商品短视频。
研究领域: 其他 项目简介: 该项目主要关注于在病人的综合心脏病精准诊断上,如何探索最优的cMR影像模态组合,用AI创新来实现精准诊断准确度的科学上的最优+影像模态组合的最优(不影响诊断精度的情况下,用最方便,最低费用的组合)quality up + cost down + patient convenience。目前的心脏病诊断临床现状是使用很昂贵的LGE-MRI序列,也很依赖医生的诊断水平。导致医疗资源很难下沉。 合作团队:浙大二王建安院士团队 1,子项目:目前Circulation 2021/2024的文章已经做了Cine+T1 Mapping生成LGE,去年2024年Nature Medicine的文章做了Cine+LGE通过AI诊断心血管疾病,我们是否可以把这两个idea进行1+1>2的效果,我们尝试Cine+T1 Mapping通过AI诊断心血管疾病。因为这样节省了病人扫描时间至少20min以上,另外就是也是contrast free的。之前的工作积累是只用Cine来诊断3/5类重要的心肌疾病,取得了不错的不错结果。外部参考资料是最近发表的Circulation 2021, 2022,Nature Medicine 2024工作。 2,子项目:第二个方向是浙大二中心也在开展冠脉磁共振(MRCA)检查,但是目前MRCA相较于以前常规做的CTA,因为分辨率的问题,还有基于边界条件的插补以及分辨率增强的想法,是否可以通过AI加强MRCA的分辨率,可以提高MRCA的诊断能力。因为MRCA是没有辐射,而且也是没有造影的,所以现在越来越多的病人都想来做MRCA,但是目前临床面对这个检查,就是分辨率还有诊断能力不够。用MRCA+AI来替代CTA。Potential Topic: Artificial Intelligence for Resolution Enhancement and Diagnosis Accuracy in MRCA
我们正在寻找对人工智能、多模态数据处理、系统性能优化感兴趣的实习生,参与一个面向多模态数据获取、解析、压缩与高效传输的研究课题。该课题聚焦于提升多模态系统在复杂环境下的实时性表现与资源利用率,具有广泛的应用前景(如智能运维、RAG检索增强生成、边缘计算等)。你将参与的工作包括但不限于: 1. 多模态数据采集与预处理:从网页、API、数据库、摄像头、麦克风等来源获取文本、图像、音频和视频数据; 2. 多模态数据解析与特征提取:使用OCR、ASR、NLP、CV等技术解析不同模态内容; 3. 模型轻量化与加速:探索基于Transformer、CNN、LSTM等模型的压缩、蒸馏、量化方法; 4. 系统级优化与部署:设计低延迟、低资源占用的数据处理流程,支持在边缘设备上运行; 5. 性能评估与实验分析:构建测试集,评估系统的吞吐量、响应时间、准确率等关键指标; 6. 撰写技术文档与研究报告:整理实验过程、结果与改进建议。 技术要求(优先但不强制): 1. 熟悉Python编程语言,有良好的代码规范; 2. 了解基本的NLP、CV或语音识别技术; 3. 掌握至少一种深度学习框架(PyTorch/TensorFlow); 4. 熟悉Linux系统及常用命令行工具。 有以下经验者优先考虑: 1. 多模态任务处理经验(如CLIP、Flamingo等); 2. 模型压缩与部署经验(如TensorRT、ONNX、OpenVINO、TVM等); 3. 使用过音视频处理工具(如FFmpeg、OpenCV、Whisper、YOLO等); 4. 有一定系统编程能力(C/C++、CUDA、FPGA基础)。