蚂蚁金服研究型实习生-垂类大模型研发
任职要求
研究领域: -目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位 -具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScript或Go -具有上述研究领域的相关经验,包括行业经验或作为参与实验室研究 优先录用: -对技术研究充满热情,具有产生新思想和创新的能力; 在自学,问题分析和解决方面表现出色 -在国际会议上或核心期刊发表一份或多份出版物或论文 -至少3个月的全职工作
工作职责
研究领域: 人工智能 项目简介: 在如今技术背景下,大模型事实性是指大型语言模型生成的内容与既定事实保持一致的能力,这种一致性是确保模型输出准确、可靠信息的基础,对于模型在各种应用场景中的表现至关重要。
大模型的科学知识和文本推理能力是体现大模型智能程度的重要标准,而如何通过大规模算力显著提高大模型的相关能力目前仍是亟待被探索的。本项目旨在研究通过相关预训练数据挖掘合成、专项post-training优化、reward模型构建等技术提升大模型的专项能力并进一步反哺给通用模型。 拟解决的技术问题包括但不限于: -科学、文本推理类预训练数据的高效挖掘、构建 -科学、文本推理类数据的大规模自动合成 -科学、文本推理类能力的自动评测建设 -科学、文本推理类能力的post-training专项优化 -科学、文本推理类能力的reward model专项优化
研究领域: 深度学习 项目简介: 在当今数字经济飞速发展的背景下,支付宝作为全球领先的金融科技平台,其巨大的用户流量形成了丰富且多维的海量流量数据。这些流量数据表示着用户的端内端外行为动线,能够反映出用户的心智偏好或者风险意图。但是目前对于端内流量的认知和盘点严重依赖人工,需要人工发现流量中的问题,并且总结流量表现的行为模式,整个过程费时费力。大模型的横空出世提供了一种通用的流量认知方案,能够识别出用户在端内的行为模式。由于垂类模型优化下,大模型的通用性能常常遭遇极速衰退,因此需要持续学习。
专注于视频理解与生成应用算法研究,具体研究内容包括: 1.视频理解:通过高质量数据构建方案,实现视频的精细主体/运动/场景描述以及长视频结构化描述(如人物关系、情节发展、故事主旨),支持长视频问答与精准时序定位。同时结合R1等前沿思维链技术解析复杂视频事件,视频逻辑推理等; 2.视频生成:聚焦视频DiT/AR等前沿架构下的垂类微调,包括复杂人体运动/场景动效生成与可控编辑技术,研究多模态指令驱动的视频编辑、人体运动增强及物理约束建模方法,提升生成视频的动态质量与风格迁移能力。