蚂蚁金服【蚂蚁星-Plan A】多模态大模型研发-生成与理解统一(实习)
任职要求
1. 计算机科学、人工智能、数学等相关专业硕士及以上学历,博士优先; 2. 深入掌握Transformer/BERT/GPT等架构,有1个以上千亿参数大模型实战经验(训练/推理/优化全流程); 3. 精通多模态技术栈:CLIP/BLIP/Flamingo等跨模态模型调优,熟悉Diffusion/Stable Diffusion等生成模型; 4. 熟练使用PyTorch/TensorFlow框架,有Megatron-DeepSpeed/FairScale等分布式训练实战经验; 5. 掌…
工作职责
蚂蚁集团 - 基础智能团队 我们团队主要负责蚂蚁集团的通用大模型研发工作。我们提供国内顶尖的算力资源,致力于建设基于大模型的AGI技术。我们期待同样以实现AGI为目标的您的加入,共同推动人工智能技术的发展。目前,我们正在进行: 多模态大模型研发: 研发高效的多模态预训练模型架构。探索和实现多模态融合技术,优化多模态模型的训练策略和推理效率。 1. 统一架构研发 研发多模态理解与生成一体化架构,设计统一表征模型(文本/图像/视频/语音),攻克跨模态语义对齐、动态路由、混合模态生成等关键技术 主导千亿级参数多模态模型的分布式训练优化(数据并行+流水线并行+专家混合),实现训练成本降低与性能提升 2. 端到端系统构建 构建支持多模态输入输出的实时交互系统(端到端延迟<200ms),优化推理引擎(KV Cache量化、动态批处理、显存卸载) 开发多模态自监督学习框架,实现跨模态数据自动挖掘与合成(如视频-文本弱监督对齐) 3. 技术前瞻研究 探索多模态大模型技术边界,包括但不限于:理解与生成统一、跨模态融合、多模态世界模型构建 参与制定行业技术标准,主导国际顶会论文发表(CVPR/ICML/NeurIPS)及开源项目贡献
蚂蚁集团 - 基础智能团队 我们团队主要负责蚂蚁集团的通用大模型研发工作。我们提供国内顶尖的算力资源,致力于建设基于大模型的AGI技术。我们期待同样以实现AGI为目标的您的加入,共同推动人工智能技术的发展。目前,我们正在进行: 多模态大模型研发: 研发高效的多模态预训练模型架构。探索和实现多模态融合技术,优化多模态模型的训练策略和推理效率。 1. 统一架构研发 研发多模态理解与生成一体化架构,设计统一表征模型(文本/图像/视频/语音),攻克跨模态语义对齐、动态路由、混合模态生成等关键技术 主导千亿级参数多模态模型的分布式训练优化(数据并行+流水线并行+专家混合),实现训练成本降低与性能提升 2. 端到端系统构建 构建支持多模态输入输出的实时交互系统(端到端延迟<200ms),优化推理引擎(KV Cache量化、动态批处理、显存卸载) 开发多模态自监督学习框架,实现跨模态数据自动挖掘与合成(如视频-文本弱监督对齐) 3. 技术前瞻研究 探索多模态大模型技术边界,包括但不限于:理解与生成统一、跨模态融合、多模态世界模型构建 参与制定行业技术标准,主导国际顶会论文发表(CVPR/ICML/NeurIPS)及开源项目贡献
蚂蚁集团 - 基础智能团队 我们团队主要负责蚂蚁集团的通用大模型研发工作。我们提供国内顶尖的算力资源,致力于建设基于大模型的AGI技术。我们期待同样以实现AGI为目标的您的加入,共同推动人工智能技术的发展。目前,我们正在进行: 多模态大模型研发: 研发高效的多模态预训练模型架构。探索和实现多模态融合技术,优化多模态模型的训练策略和推理效率。 1. 统一架构研发 研发多模态理解与生成一体化架构,设计统一表征模型(文本/图像/视频/语音),攻克跨模态语义对齐、动态路由、混合模态生成等关键技术 主导千亿级参数多模态模型的分布式训练优化(数据并行+流水线并行+专家混合),实现训练成本降低与性能提升 2. 端到端系统构建 构建支持多模态输入输出的实时交互系统(端到端延迟<200ms),优化推理引擎(KV Cache量化、动态批处理、显存卸载) 开发多模态自监督学习框架,实现跨模态数据自动挖掘与合成(如视频-文本弱监督对齐) 3. 技术前瞻研究 探索多模态大模型技术边界,包括但不限于:理解与生成统一、跨模态融合、多模态世界模型构建 参与制定行业技术标准,主导国际顶会论文发表(CVPR/ICML/NeurIPS)及开源项目贡献
风控技术是蚂蚁大安全技术最核心的团队之一,全面支持蚂蚁支付宝、国际、数金几大板块的风险防控技术能力建设,子方向包括资金风控、内容安全、流量作弊风控、核身等硬核技术,用大数据和AI能力,构建蚂蚁金融和数字化风控技术底盘,保证了风险水位的长期持续稳定。团队敢于打硬仗,不断挑战行业型不确定性技术课题。 面向蚂蚁海量用户,日亿级交易,我们希望用大模型技术重构风控攻防的底层逻辑,结合万亿样本,进行大模型算法/工程/应用的全栈建模,选型,设计,研发,和优化,端到端解决风险防控问题,通过各种创新(如黑产对抗的强化学习,防控特征/策略的生成,面向对抗的多模态算法/系统设计和优化等),用智能化突破现有风险对抗体系的上限,保障支付宝的每一个客户的资金安全,为每一次支付保驾护航。
作为蚂蚁集团核心安全数据中枢,我们构建金融级全域智能安全防御体系,深耕风险防控、数据资产保护、网络攻防对抗、内容生态治理等关键领域。依托EB级全域安全数据资产与万亿级实时计算能力,为集团数字支付、数字互联生态、数金业务矩阵(网商银行、财富管理、保险科技)、数字科技输出及全球化业务提供全链路安全赋能。 我们依托先进的大数据分析技术和机器学习算法,深度挖掘数据中潜藏的风险与威胁,通过智能预测与主动防御机制,实现安全事件的精准识别与快速响应。持续追踪前沿技术发展,整合大数据、大模型和AI生成技术,成功打造了规模超千亿的多模态安全训练数据集。这些高质量数据集已成为集团大模型安全基础训练语料,广泛应用于大模型安全防御、大模型去毒及身份核验等关键安全领域。加入我们,你将有机会投身于前沿技术的研发与应用,亲身探索全球领先的科技创新成果。我们不仅提供行业领先的薪酬福利体系,更致力于为你营造专业、开放且富有活力的工作氛围。如果你对安全技术与数据应用怀有热忱,渴望在充满创新机遇与专业挑战的环境中实现职业成长,我们诚挚邀请你加入安全大数据技术团队!让我们携手共建智能安全新未来! 1.负责设计先进数据评估方法:创建科学指标体系与测量工具,评估数据质量、贡献度与分布特性,为AI模型优化提供明确方向。研究数据的重要性与影响,探索动态数据价值量化技术(如Shapley值、类边际贡献算法); 2.负责数据驱动决策支持:利用统计学、机器学习与实验设计方法,构建逻辑推演与预测模型,提供数据洞察与业务指导; 3.大规模数据优化:从海量数据中发现异常模式与长尾现象,开发动态数据增强与去噪技术,突破数据复杂性极限; 4.前沿应用研究:探索自监督学习、强化学习等前沿技术领域的数据应用,将数据科学引入学术与工业无人区。