阿里云研究型实习生 - 通算智算一体化性能分析诊断方法与深度优化
任职要求
1. 扎实的计算机科学与工程功底,优秀的编程能力(精通或熟练掌握C/C++/Python等),熟悉常用数据结构、算法和设计模式,具备复杂系统设计、开发与调试经验。 2. 优秀的沟通表达、团队协作能力;具备快速学习新知识和深入钻研复杂技术问题的能力与耐心。 3. 深入理解计算机体系结构(CPU/GPU/NPU等)、操作系统、编译原理、分布式系统等基础知识。 4. 具备以下至少一个领域的深入实践经验: ·高性能计算(HPC),特别是异构计算环境下的性能分析与优化。 ·GPU编程与优化(如CUDA, ROCm, OpenCL等),熟悉GPU架构。 ·系统性能分析与调优工具(如perf, eBPF, VTune, Nsight Profiler等)的开发或深度使用经验。 ·虚拟化(KVM/QEMU等)、容器技术(Docker/Kubernetes等)及其性能优化。 ·分布式系统调度与资源管理(如YARN, Mesos, Kubernetes Scheduler等)。 5. 对AI大模型训练/推理框架(如PyTorch, TensorFlow, TensorRT, Triton等)有一定了解,并对其系统层面的性能优化有兴趣。 加分项: 1. 在相关领域的顶级会议/期刊(如OSDI, SOSP, ASPLOS, ISCA, MICRO, SC, NSDI, EuroSys, ATC等)有论文发表者优先。 2. 对大规模AI模型(如LLM)训练/推理、大数据处理等复杂应用场景的系统性能瓶颈有深入理解和实际优化经验者优先。 3. 具有GPU高性能Kernel(CUDA/ROCm等)开发和极致优化经验者优先。 4. 有参与新硬件(如自研CPU/GPU/NPU,例如倚天)评估、适配和优化经验者优先。 5. 有重要开源项目(如Linux Kernel, GCC/LLVM, Kubernetes, PyTorch/TensorFlow等)贡献经验者优先。 6. 熟悉云原生技术栈,并有相关性能优化经验者。
工作职责
1. 探索通算智算一体化场景下,端到端性能分析诊断体系的研究与构建,覆盖从底层硬件(CPU、GPU、NPU等)、系统软件到上层分布式框架和应用负载。 2. 深入研究CPU-GPU异构计算系统、分布式框架、系统软件栈(如操作系统、编译器、运行时)的性能瓶颈,提出并实现创新的软硬件协同优化方案。 3. 开发和落地先进的性能监控、剖析和诊断工具,支持从底层硬件指标到上层业务负载的全链路追踪与精准瓶颈定位。 4. 针对大规模AI模型训练/推理、通用计算等多样化负载,探索和实践GPU等异构资源的调度优化、资源容错、任务状态保存/恢复与快速迁移等关键技术,提升资源利用率和系统稳定性。 5. 研究内存(包括CPU内存和GPU显存)与计算的协同优化方案,旨在提升训推场景性能,降低整体成本,并优化资源利用率。 6. 将研究成果应用于阿里云平台及相关产品服务,提升云平台的整体性能、资源利用率和性价比,支持关键业务场景。 7. 在顶级学术会议和期刊上发表研究成果,并积极参与开源社区合作与技术推广,提升团队和公司在相关领域的技术影响力。
研究领域: 人工智能 项目简介: 实时语音交互在大模型应用落地中对于提升用户对话体验,提升用户留存(豆包app加入语音对话后留存率提升明显)具有重要作用;在AI硬件领域(AI眼镜、戒指等),实时语音交互是直接的、天然的交互方式,且对语音理解的准确率、语音生成的自然度、对话准确率、交互响应速度都有较高的要求
研究领域: 人工智能 项目简介: 在大模型的国际化应用落地过程中,要解决几个核心的问题: 1. 大模型对于小语种的支持:在蚂蚁国际化场景中,既有中英文这样的大规模使用的语言,也有东南亚,欧洲,非洲等各的确相对较小语种的实际需求,这些小语种的语料相对而言获取难度高,也导致了大模型在应用落地过程中会遇到许多困难,探索一条高效可行的道路来扩充大模型对于小语种的支持是在业务和技术上都有着突破意义的工作 2. 大模型对于体验的支持:在模型的使用过程中,探索更好的用户体验需要进行相当的投入来保持对于体验的关注和不断尝试,既包括通过推理模型来提升模型回复能力,也包括通过长思考能力来提升问题解决的思路完备性,也可以借助于大模型的代码生成等推理能力来生成交互式界面,或者通过多模态模型来进行包括视频在内的AIGC等,在应用过程中有很多细节需要结合大模型基座进行优化 3. 模型可信:在金融场景中,模型回复的准确性和安全性至关重要,结合业务场景进行探索模型的grounding,知识注入和幻觉消除等工作
研究领域: 人工智能 项目简介: 随着人工智能技术的快速发展,多模态大模型(Multimodal Large Language Models, MLLMs)在跨模态理解与生成领域取得了突破性进展。然而,在图像分割、目标识别及定位、视觉关系理解、目标计数等基础视觉任务中,现有MLLMs与传统视觉模型仍存在显著性能差距。这种短板严重制约了多模态技术在视频分析、图像识别等高精度视觉场景中的应用落地。 本项目期望探索更有效的多模态视觉表征,及视觉与LLM融合机制,提升多模态能力上限。
研究领域: 隐私计算 项目简介: 在蚂蚁国际的各种在线业及离线务中,由于各国之间的法律法规差异、监管合规要求以及合作机构的意愿,国际业务数据常常面临区域间、机构间隔离的挑战,形成数据孤岛。外部合作机构/商户的数据不能出境、不愿出域。合作商户对数据保护意识强,撬动难度大。 为解决这些问题,我们希望在保证数据隐私的前提下,利用隐私计算MPC(Secure Multi-Party Computation)技术,进行联合计算和分析,确保数据在计算过程中不被泄露,实现跨区域、跨机构的数据协同。 1.负责密码学前沿技术跟踪和创新预研,进行隐私计算高性能、高精度、通用化方面的的基础研究; 2.负责将隐私计算技术应用于现实问题,面向场景优化的密码算法和系统; 3.跟踪、探索隐私计算方向前沿技术,并适时进行技术分享、专利申请和学术文章发表。 4.通过行业深度洞察以及前膽性思考,探索前沿技术、预研新场景,引导行业标准制定以及打造全球领先的行业品牌心智。