通义研究型实习生-高性能大规模分布式图计算系统
任职要求
1、博士/硕士研究生,计算机等相关专业优先。
2、有扎实的理论基础,对大模型相关技术研究感兴趣。
3、在相关顶会或期刊发表论文、在高水平技术评测或竞赛中获得Top成绩、在开源组织有贡献或影响力者优先。
工作职责
超大规模图计算在大数据场景中发挥着越来越重要的作用。图计算的经典问题如可达性、社区检测、链路预测和模式匹配等已经在搜索推荐、金融风控等场景的实践中被验证效果显著;同时,图计算也越来越作为下一代机器学习和推荐系统的基础,成为GNN/GCN端到端解决方案的重要一环。然而,图计算在大规模应用的过程中,还有很多未决问题。如何复用已有的诸多图算法来处理超大规模图数据?如何兼顾超大规模环境下图计算的性能和用户易用性?图计算如何与TensorFlow/pyTorch等机器学习平台共同工作来完成一个端到端分析型计算?这一系列问题都十分具有挑战。 本项目包含以下研究方向: - 针对现有超大规模图计算系统中存在的海量规模计算和需要持久化存储的问题,需要设计和实现高效的存储结构和缓存机制; - 针对现有一站式图系统中存在的多范式计算问题,需要在新设计的高效存储结构中均衡在TP和AP场景下的性能表现; - 针对现实场景中图数据的高频动态变化,新设计的高效存储和缓存需要满足动态图变化的需求,并让系统具有优秀的弹性性能。
本项目结合当前人工智能大模型的前沿发展和阿里云基础设施,研究基于软硬结合的AI基础设施,具体包括以下几个方面: 1) 针对大规模分布式训练创新性系统评估和性能优化 ;2) 针对大模型训练的计算、网络、存储组件的创新性研究; 3) 针对大规模分布式训练的稳定性研究
专注于大规模分布式文生视频/文生图推理系统的研究、探索和开发,具体职责包括: 探索高性能、可扩展的分布式 DiT 推理引擎,支持大规模文生视频/文生图场景的高效部署; 深入优化高性能算子、运行时、分布式策略等,打造业界领先的DiT推理引擎; 分析现有引擎和典型负载的性能瓶颈,提出并实现创新的优化技术; 针对文生视频/文生图等重点场景,构建业界领先的优化解决方案。
随着全球主要市场陆续出台用户个人信息保护政策,整个互联网生态中的数据安全和用户隐私保护问题变得越发重要且日趋严格。如何在营销场景下实现对隐私数据的安全合规使用,维护在线广告商业模型的核心运作,成为当下广告生态中各企业急需解决的问题。 该职位的主要工作包含: 1. 高性能MPC隐私算法的调研、设计及代码开发,实现在大规模数据集下的分布式计算,应用于阿里妈妈广告业务对外数据合作场景。 2. 对业界前沿隐私保护技术保持敏感,梳理和提出创新的隐私计算算法,发表到领域内顶会期刊。
研究领域: 隐私计算 项目简介: 在蚂蚁国际的各种在线业及离线务中,由于各国之间的法律法规差异、监管合规要求以及合作机构的意愿,国际业务数据常常面临区域间、机构间隔离的挑战,形成数据孤岛。外部合作机构/商户的数据不能出境、不愿出域。合作商户对数据保护意识强,撬动难度大。 为解决这些问题,我们希望在保证数据隐私的前提下,利用隐私计算MPC(Secure Multi-Party Computation)技术,进行联合计算和分析,确保数据在计算过程中不被泄露,实现跨区域、跨机构的数据协同。 1.负责密码学前沿技术跟踪和创新预研,进行隐私计算高性能、高精度、通用化方面的的基础研究; 2.负责将隐私计算技术应用于现实问题,面向场景优化的密码算法和系统; 3.跟踪、探索隐私计算方向前沿技术,并适时进行技术分享、专利申请和学术文章发表。 4.通过行业深度洞察以及前膽性思考,探索前沿技术、预研新场景,引导行业标准制定以及打造全球领先的行业品牌心智。