蚂蚁金服研究型实习生-人机物融合时代的身份识别技术探索
任职要求
研究领域: -目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位 -具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScript或Go -具有上述研究领域的相关经验,包括行业经验或作为参与实验室研究 优先录用: -对技术研究充满热情,具有产生新思想和创新的能力; 在自学,问题分析和解决方面表现出色 -在国际会议上或核心期刊发表一份或多份出版物或论文 -至少3个月的全职工作
工作职责
研究领域: 生物识别&IoT 项目简介: 百镜大战、俱身智能风起云涌,消费级可穿戴设备、人形机器人即将出现在日常生活场景中,此类设备普遍价格较高(丢失或被盗会产生较大经济损失),接收和存储了更多的个人(甚至是整个家庭)高敏隐私数据(需要可信确权及鉴权),在此背景下,人、机、物综合身份安全面临更高的挑战,手机端的传统身份识别方式受限安全与体验无法直接迁移,需要探索人机交互和泛智能设备的生物感知及识别技术,实现人机物融合新范式的身份可信。项目目标为:探索含音视觉在内的新型生物识别技术,身份识别安全体验水位与手机端拉齐(通过率>95%、FAR<1/百万)
研究领域: 计算机视觉 项目简介: 随着人工智能技术的迅猛发展,尤其是在计算机视觉、语音、自然语言处理和人机交互等领域的突破,基于自研多模态认知架构构建的新一代人工智能系统,深度融合视觉、语音、文本等多维度感知能力。实现多源信息的实时对齐与协同推理,可灵活部署于云端、边缘设备等多种场景。
研究领域: 隐私计算 项目简介: 1.项目背景 在人工智能技术快速发展的今天,UIAgent(用户界面智能代理)正成为下一代人机交互的核心入口。然而,如何获得或构建海量多模态数据(如行为轨迹、界面标注信息、系统动线日志等)是研究的关键。但如何在保障数据隐私合规的前提下,完成高质量的场景重建与语料建模,已成为制约技术落地的关键瓶颈。本课题聚焦这一核心矛盾,探索隐私保护与数据效用之间的最优平衡,为UIAgent提供安全、合规、可用的基础数据支撑。 2.研究目标 本项目旨在构建一套全流程隐私保护框架,解决以下核心问题: 多源异构数据脱敏:针对文本、图像、时序行为等多模态数据,设计可组合的隐私擦除策略; 场景语义保真重建:在去除个人身份信息(PII)的同时,保留用户行为模式与系统交互逻辑的语义完整性; 隐私-效用博弈建模:通过理论分析与实验验证,量化隐私预算与模型性能间的权衡关系。 3.核心亮点 生成式隐私增强技术:基于扩散模型/VAE生成合成数据,既还原真实场景分布又规避隐私泄露风险; 行为轨迹知识蒸馏:将原始轨迹中的高敏感操作(如输入内容)抽象为低维符号序列,保留系统动线拓扑结构; 极致数据压缩技术:UIAgent的核心目标是理解和预测用户的界面交互行为,而非复现像素级视觉细节,将探索最小必要数据的边缘。
专注于多模态大模型与人机交互技术的创新研究及实践,具体职责包括: 1、探索多模态大模型(文本/图像/语音/视频等)的交互式应用场景,研发新型人机交互范式; 2、针对多模态交互复杂任务推理进行探索及研究,提升多模态、多跳推理场景下的复杂任务完成率; 3、优化多模态数据的融合算法,提升模型对复杂交互场景的理解与响应能力; 4、构建高效的多模态交互系统模型架构,研究低延迟、高并发的实时交互技术方案。