logo of antgroup

蚂蚁金服研究型实习生-AIGC时代音频防伪检测技术研究-1

实习兼职研究型实习生地点:上海 | 杭州状态:招聘

任职要求


1、目前正在攻读计算机科学或相关STEM领域的硕士或博士学位
2、掌握一种或多种通用编程语言,包括但不限于C/C++Python
3、具有语音领域的相关研发经验,对前沿技术研究充满探索热情

优先录用
1、思维活跃,具有创新能力,在分析问题和解决问题方面表现出色;编程能力优秀
2、在语音顶会或顶刊(如ICASSP/INTERSPEECH/ASRU/TASLP)发表过一篇或多篇高水平论文
3、至少六个月的全职工作时间

工作职责


研究领域:
  机器学习
项目简介:
  AIGC技术层次不穷,新的AIGC技术浪潮迅猛发展,与此同时,我们必须提升AIGC防伪检测的水平。例如:互联网上充斥着大量“以假乱真”的音视频内容,将影响正常的社会舆论趋势和人的审美美感,也伴随着一些内容安全隐患,可能对人类的价值观和道德观产生负面的影响,需要引起重视。 AIGC典型应用包括:深度伪造视频,深度伪造音频,或者部分深度伪造视频中也包含一些深度伪造的音频,本子课题重点针对音频深度伪造的检测技术。常用的音频深度伪造有逻辑攻击和物理攻击两大类,其中,物理攻击------采用变声器等录音设备进行声音转换,或录音重放等方式生成伪造语音数据;逻辑攻击------通过语音合成Text-to-Speech(TTS) ,音色转换Voice Conversion(VC)和语音克隆Voice Cloning(VC)等深度网络方法生成伪造音频。探索AIGC时代音频防伪技术,加强安全防控,防范新型未知风险。
包括英文材料
学历+
C+
C+++
Python+
相关职位

logo of alibaba
实习淘天集团研究型实

我们是阿里妈妈智能创作与AI应用团队, 长期从事利用CV NLP等多模态和多媒体技术进行内容创作、内容理解的算法工作,团队耕耘技术多年,在电商创意素材生成领域 有广泛的业界影响力,研发出阿里妈妈创意中心、万相实验室等产品以及阿里妈妈智能图片制作(Auto Poster)、阿里妈妈视频生成(AtomoVideo)等技术,研究成果发表在 CVPR、ICCV、AAAI、ACM MM、WWW、ACL 等学术顶会。 我们诚挚欢迎你加入团队,工作内容为下列之一: 1. 需要1年Diffusion Models扩散图像生成经验(强相关)。1年图像领域相关经验。 2. 需要在广告 或者 电商 场景的图像算法应用经验。 3. 需要在图像生成方向有顶会论文,CVPR,ECCV,NIPS,MM。

更新于 2025-09-08
logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: AIGC持续发展,以人为中心的图像、视频、语音等模型的生成能力愈发成熟,最近动动嘴就能PS、图像、视频及语音等产品例如25年3月发布的谷歌的Gemini 2.0Flash以及字节的SeedEdit等产品,迅速走进大众,AIGC等对抗愈发激烈且常态化。目前防控手段都是单模态进行防控,所有模态All-in-one的omini模型目前尚未有好的工作,同时结合类似deepseek多模态推理解决泛化能力、文本之外基于基于多模态生成式的视觉Reward去打造新的左右互搏式LMM范式,以及世界模型思路下去预测未来攻击的方案,都是当下可以探索的思路,目标是围绕AI信息原生可信打造成安全特色能力。

logo of antgroup
实习研究型实习生

研究领域: 网络与信息安全 项目简介: 随着AIGC技术的快速发展,DeepFake攻击的成本越来越低,攻击规模也越来越大,本项目聚集研究前沿的多模态Deepfake攻防技术,利用大模型等AI技术生成高质量对抗样本,对内部AIGC产品进行高强度、自动化和智能化攻防演练。场景包括:图片凭证、人脸视频、声纹等Deepfake攻防。

logo of amap
实习高德研究型实习生

1.跟踪和探索前沿生成式技术,包括但不限于多模态技术、大语言模型、可控图像生成、图像编辑、视频生成等。 2.研究和应用相关技术,帮助技术在实际业务(内容、广告、智能创作等)的落地。 3.具备一定的论文撰写能力和科研能力。

更新于 2025-03-27