logo of alibaba

阿里巴巴研究型实习生-高性能隐私计算算法研究与应用

实习兼职淘天集团研究型实习生地点:北京状态:招聘

任职要求


1.信息安全、网络空间安全等相关专业的硕士生/博士生;
2.熟悉隐私保护方向前沿技术,对多方安全计算 (MPC) 、联邦学习、隐私保护机器学习 (PPML)等至少一个领域有深入理解;
3.满足以下一个或多个条件者优先:
  a. 在国际顶级会议或期刊发表过文章;
  b. 有丰富的相关领域经验,在GitHub等开源社区有重要贡献;
  c. ACM等顶级竞赛获奖者优先。
4.较好的主动性和求知欲,良好的沟通协作和抗压能力。

工作职责


随着全球主要市场陆续出台用户个人信息保护政策,整个互联网生态中的数据安全和用户隐私保护问题变得越发重要且日趋严格。如何在营销场景下实现对隐私数据的安全合规使用,维护在线广告商业模型的核心运作,成为当下广告生态中各企业急需解决的问题。
该职位的主要工作包含:
1. 高性能MPC隐私算法的调研、设计及代码开发,实现在大规模数据集下的分布式计算,应用于阿里妈妈广告业务对外数据合作场景。
2. 对业界前沿隐私保护技术保持敏感,梳理和提出创新的隐私计算算法,发表到领域内顶会期刊。
包括英文材料
机器学习+
GitHub+
C+
相关职位

logo of antgroup
实习蚂蚁技术研究院长

职位描述: 1.开展图计算与隐私计算交叉领域的研究,探索安全融合各类关联数据,全面深入地建模和分析复杂场景的方法,挖掘图数据的价值和图计算的能力; 2.探索各类软硬件结合的优化手段,充分挖掘并不断逼近保护数据隐私安全的前提下多方图计算系统的性能极限; 3.解决前沿的图隐私计算技术问题,将相应成果以论文形式发表到顶尖学术会议/期刊,并与研发团队协作落地到实际场景; 4.研究方向包括但不限于:多方图查询协议与算法,多方图分析与图学习框架,高性能图隐私计算系统,安全可信的图智能,等等。

logo of antgroup
实习研究型实习生

研究领域: 隐私计算 项目简介: 在蚂蚁国际的各种在线业及离线务中,由于各国之间的法律法规差异、监管合规要求以及合作机构的意愿,国际业务数据常常面临区域间、机构间隔离的挑战,形成数据孤岛。外部合作机构/商户的数据不能出境、不愿出域。合作商户对数据保护意识强,撬动难度大。 为解决这些问题,我们希望在保证数据隐私的前提下,利用隐私计算MPC(Secure Multi-Party Computation)技术,进行联合计算和分析,确保数据在计算过程中不被泄露,实现跨区域、跨机构的数据协同。 1.负责密码学前沿技术跟踪和创新预研,进行隐私计算高性能、高精度、通用化方面的的基础研究; 2.负责将隐私计算技术应用于现实问题,面向场景优化的密码算法和系统; 3.跟踪、探索隐私计算方向前沿技术,并适时进行技术分享、专利申请和学术文章发表。 4.通过行业深度洞察以及前膽性思考,探索前沿技术、预研新场景,引导行业标准制定以及打造全球领先的行业品牌心智。

logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 本课题面向典型大模型(dense、MoE)进行软硬协同、算子级深入优化,算子包括计算、通信、访存等。 背景: 1. 大模型和搜推模型推理需求: 大模型长序列和Tab3推荐模型增长迅速,前者迈向MoE千~万亿参数,推荐模型增长到数百GB。 - 需求背后存在计算密集、访存密集和多卡推理的通信瓶颈。例如在LLM prefill阶段和多模态模型通常计算密集;LLM decode阶段和搜推模型通常访存密集。 2. 算力阉割:主流NV卡算力大幅阉割,应对以上需求存在较大技术挑战。业界针对模型也不断有算子的深入优化例如FlashAttn系列,FlashMLA,SageAttn等,包括量化、稀疏的算子。

logo of tongyi
实习通义研究型实习生

超大规模图计算在大数据场景中发挥着越来越重要的作用。图计算的经典问题如可达性、社区检测、链路预测和模式匹配等已经在搜索推荐、金融风控等场景的实践中被验证效果显著;同时,图计算也越来越作为下一代机器学习和推荐系统的基础,成为GNN/GCN端到端解决方案的重要一环。然而,图计算在大规模应用的过程中,还有很多未决问题。如何复用已有的诸多图算法来处理超大规模图数据?如何兼顾超大规模环境下图计算的性能和用户易用性?图计算如何与TensorFlow/pyTorch等机器学习平台共同工作来完成一个端到端分析型计算?这一系列问题都十分具有挑战。 本项目包含以下研究方向: - 针对现有超大规模图计算系统中存在的海量规模计算和需要持久化存储的问题,需要设计和实现高效的存储结构和缓存机制; - 针对现有一站式图系统中存在的多范式计算问题,需要在新设计的高效存储结构中均衡在TP和AP场景下的性能表现; - 针对现实场景中图数据的高频动态变化,新设计的高效存储和缓存需要满足动态图变化的需求,并让系统具有优秀的弹性性能。

更新于 2024-11-14