阿里云研究型实习生 - 基于多核架构的数据库内核性能研究
任职要求
1)计算机科学或相关领域的本科及以上学历;具有扎实的数据结构、算法基础及良好的编程习惯;熟悉C/C++语言,了解Linux内核及其网络协议栈。 2)了解数据库MySQL,PostgreSQL内核的基本原理,有实际项目经验者优先;具备分布式系统设计与开发经验,对数据库和存储技术有一定理解。 3)具备优秀的沟通能力和团队合作精神,能够清晰表达复杂的技术概念,善于倾听他人意见并积极贡献自己的想法。 4)拥有快速学习新技术的能力,愿意接受挑战,能够在快节奏的研发环境中持续成长。 5)在数据库、存储、网络、分布式系统等领域发表过高质量论文或参与过重要科研项目。 6)获得过HPC、ACM-ICPC以及阿里云、腾讯云、华为云竞赛奖项的优先。"
工作职责
基于多核架构的数据库性能优化研究,具体职责包括: 1. 参与基于多核架构MySQL,PostgreSQL数据库的优化与实现,降低数据同步延迟和提升内存访问效率; 2. 构建并测试多核架构下MySQL,PostgreSQL的性能,确保其在高并发、低延迟场景下的性能优势,并根据实验结果进行迭代优化; 3. 与团队成员紧密合作,共同探索多核架构下MySQL,PostgreSQL等数据库中的最佳实践,推动技术创新与应用; 4. 负责制定详细的性能测试计划,分析原型系统的性能瓶颈,并提出有效的优化策略。
1. 在AI/HPC突发流量激增的背景下,探索软硬件协同设计新的方法,重构软硬件功能边界,实现异构计算资源的深度融合与动态适配 2. 多核协同调度机制:构建基于资源感知的动态调度算法,建立多维约束条件下的最优任务分配模型 3. 关键性能瓶颈突破:重点攻克时延抖动抑制、缓存资源动态分配等核心挑战,建立面向服务质量保障的调度优化框架;
我们正在寻找对人工智能、多模态数据处理、系统性能优化感兴趣的实习生,参与一个面向多模态数据获取、解析、压缩与高效传输的研究课题。该课题聚焦于提升多模态系统在复杂环境下的实时性表现与资源利用率,具有广泛的应用前景(如智能运维、RAG检索增强生成、边缘计算等)。你将参与的工作包括但不限于: 1. 多模态数据采集与预处理:从网页、API、数据库、摄像头、麦克风等来源获取文本、图像、音频和视频数据; 2. 多模态数据解析与特征提取:使用OCR、ASR、NLP、CV等技术解析不同模态内容; 3. 模型轻量化与加速:探索基于Transformer、CNN、LSTM等模型的压缩、蒸馏、量化方法; 4. 系统级优化与部署:设计低延迟、低资源占用的数据处理流程,支持在边缘设备上运行; 5. 性能评估与实验分析:构建测试集,评估系统的吞吐量、响应时间、准确率等关键指标; 6. 撰写技术文档与研究报告:整理实验过程、结果与改进建议。 技术要求(优先但不强制): 1. 熟悉Python编程语言,有良好的代码规范; 2. 了解基本的NLP、CV或语音识别技术; 3. 掌握至少一种深度学习框架(PyTorch/TensorFlow); 4. 熟悉Linux系统及常用命令行工具。 有以下经验者优先考虑: 1. 多模态任务处理经验(如CLIP、Flamingo等); 2. 模型压缩与部署经验(如TensorRT、ONNX、OpenVINO、TVM等); 3. 使用过音视频处理工具(如FFmpeg、OpenCV、Whisper、YOLO等); 4. 有一定系统编程能力(C/C++、CUDA、FPGA基础)。
研究领域: 人工智能 项目简介: 近年来,大语言模型和多模态大模型的迅速发展解锁了众多应用场景,包括视觉指令跟随和长视频理解,最近的一些开源方法也已经在提升流式视频处理能力方面有所进展,但它们在交互流畅性和感知能力方面仍然存在不足。本项目旨在对流式视频理解和交互方向加大投入,在多模态大模型视觉内容理解、动态变化跟踪和精确时间对齐等方面进行算法创新,并尝试挖掘其对视频交互中风险动作和风险对话的识别能力,为依赖视频交互能力的各业务场景带来新的突破。