蚂蚁金服研究型实习生-心脏多模态cMR多种心脏病精准诊断和王建安院士/院长团队研发实习生项目
任职要求
研究领域: -目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位 -具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScript或Go -具有上述研究领域的…
工作职责
研究领域: 其他 项目简介: 该项目主要关注于在病人的综合心脏病精准诊断上,如何探索最优的cMR影像模态组合,用AI创新来实现精准诊断准确度的科学上的最优+影像模态组合的最优(不影响诊断精度的情况下,用最方便,最低费用的组合)quality up + cost down + patient convenience。目前的心脏病诊断临床现状是使用很昂贵的LGE-MRI序列,也很依赖医生的诊断水平。导致医疗资源很难下沉。 合作团队:浙大二王建安院士团队 1,子项目:目前Circulation 2021/2024的文章已经做了Cine+T1 Mapping生成LGE,去年2024年Nature Medicine的文章做了Cine+LGE通过AI诊断心血管疾病,我们是否可以把这两个idea进行1+1>2的效果,我们尝试Cine+T1 Mapping通过AI诊断心血管疾病。因为这样节省了病人扫描时间至少20min以上,另外就是也是contrast free的。之前的工作积累是只用Cine来诊断3/5类重要的心肌疾病,取得了不错的不错结果。外部参考资料是最近发表的Circulation 2021, 2022,Nature Medicine 2024工作。 2,子项目:第二个方向是浙大二中心也在开展冠脉磁共振(MRCA)检查,但是目前MRCA相较于以前常规做的CTA,因为分辨率的问题,还有基于边界条件的插补以及分辨率增强的想法,是否可以通过AI加强MRCA的分辨率,可以提高MRCA的诊断能力。因为MRCA是没有辐射,而且也是没有造影的,所以现在越来越多的病人都想来做MRCA,但是目前临床面对这个检查,就是分辨率还有诊断能力不够。用MRCA+AI来替代CTA。Potential Topic: Artificial Intelligence for Resolution Enhancement and Diagnosis Accuracy in MRCA
1. 参与设计和实现融合音频理解与生成能力的统一架构,打破传统模型在“理解”与“生成”之间的壁垒; 2. 研究并开发针对长时序音频的高效建模方法,解决上下文保持难题,提升长程语义一致性和事件定位精度; 3. 提升模型在高噪声、低资源、多说话人等复杂环境下的鲁棒性,同时保证生成内容的自然度; 4. 实现跨音频类型的通用表征学习,支持零样本或少样本迁移至新任务或领域; 5. 优化模型推理效率,支持端侧部署与实时交互,满足边缘设备及移动端应用需求。
【职位描述】 我们是小红书安全风控平台部/算法策略组/内容安全组,目前专注于多模态大模型在多模态理解和内容安全场景的技术落地和产品预研,目前在相关数据&技术方向有一定的积累,并将长期持续投入。我们希望寻求优秀在读硕士生/博士生共同突破大模型在安全审核行业落地的技术挑战,作为实习生,你将有机会与产品、工程紧密合作,将研究算法应用到实际问题中,并解决有难度有价值的问题,促进领域前沿技术的发展。欢迎投递简历。该岗位的核心研究方向包括但不限于: 1. 基础多模态表征:主要研究小红书多模态数据(笔记)下的基础多模态表征工作,包括层次化表征、特征融合、自监督探索等,作为基础模型,支持多样化检索场景。 2. 通用多模态大模型:通用多模态大模型在安全领域理解相关研究,包括高效微调、多模态理解等。建立安全多模态基础模型。
面向AI场景下数据库资源优化系统研发,具体职责包括: 1.设计基于深度强化学习(DRL)的CPU/GPU混合负载调度框架,构建基于负载管理器、资源调度器的动态资源分配模型,实现资源利用率与服务质量(QoS)的联合优化; 2.研发“资源预热+缓存预热+计算编排”混合架构,通过热点数据预测模型、计算节点池化技术及数据预热机制,突破对象存储(OSS)水平弹性的性能瓶颈; 3.基于Neon分支技术改进动态数据隔离机制,设计多分支场景下的共享数据访问优化策略,在零冗余存储前提下保障租户间、branch间安全隔离,同时提升多分支并发场景下的数据访问吞吐量。
随着数据量的爆炸性增长以及业务复杂性的增加,诸如图、文档、时空、时序等非结构化数据类型规模和价值都越发重要。需要研究更有效率的非结构化数据的处理、存储、分析的技术,尤其是与结构化数据融合进行分析的手段,将来自不同来源、格式、结构或模型的数据整合到一个统一的系统中,以实现数据共享、分析和决策支持。 我们的研究内容包括: 1. GPU加速的多模态数据处理,如fts、向量检索以及索引建立。GPU高效池化以及远程GPU调用,查询算子以及后台数据重整任务的高效远程GPU卸载; 2. 非结构化数据,如json、文档等自动语义发现与解析、数据模式匹配与语义对齐、对象关联分析。结合NLP等技术,实现从原始数据到结构化语义的高效转化; 3. OLTP高效入湖。结合数据湖的灵活性(存储非结构化数据)与数据仓库的结构化管理能力(如ACID、事务支持、元数据管理),通过存储层创新、计算引擎优化和云原生技术,实现不同业务的高效协同。