蚂蚁金服【蚂蚁星】大模型工程师-AI基础设施
任职要求
1. 有基本的大模型理论和工程基础; 2. 在大模型算法/基础设施/应用等方向有一或多篇论文发表,或者在重要的相关开源项目有核心贡献,或者有自己的差异化观点和认知并能有所证明; 3. 问题和好奇心驱动,有极强的自驱力和学习能力; 4. 加分项:在数学/物理/程序等竞赛中获得优异成绩。
工作职责
作为蚂蚁集团核心风控技术部门,我们专注于解决业务风险相关的技术挑战与系统建设,覆盖资金安全、数据安全、大模型安全、反洗钱及数字化业务风控等领域。这些业务场景因强对抗性、风险形态多样化、高时效性要求等特性,对技术规模性、系统复杂度、性能极限、智能化水平及可扩展能力提出跨维度挑战。 技术沉淀与突破: 过去数十年,团队基于特征工程、策略体系、模型算法及数据驱动框架,构建了具备行业领先水平的智能风控基础设施,持续守护超大规模业务的安全运行。 未来方向与目标,在大模型技术驱动的新阶段,我们计划联合顶尖人才突破以下核心方向: 大模型驱动的风控基建:研发生成式AI为核心的智能引擎,提升风险识别与对抗能力; 自主进化的防御体系:深度结合业务理解与模型技术,构建风险防护、用户行为分析、产品风险识别的核心能力; 技术前沿探索:攻坚大模型在风控场景中的安全应用、动态对抗机制及可扩展性难题; 我们期待与具备顶尖技术视野与工程能力的候选人合作,共同定义下一代智能风控的技术标准。 结合安全各种风险场景,如黑产攻击,风险防控,权限管理,多模态内容理解,进行大模型算法/工程/应用的全栈/全流程建模,选型,设计,研发,和优化,并在基础设施或者应用有所创新和突破(如Prompt自动优化,SFT自适应,分布式训练编译调度,黑产对抗的强化学习,防控特征/策略的生成,面向对抗的多模态算法/系统设计和优化等)。
风控技术是蚂蚁大安全技术最核心的团队之一,全面支持蚂蚁支付宝、国际、数金几大板块的风险防控技术能力建设,子方向包括资金风控、内容安全、流量作弊风控、核身等硬核技术,用大数据和AI能力,构建蚂蚁金融和数字化风控技术底盘,保证了风险水位的长期持续稳定。团队敢于打硬仗,不断挑战行业型不确定性技术课题。 面向蚂蚁海量用户,日亿级交易,我们希望用大模型技术重构风控攻防的底层逻辑,结合万亿样本,进行大模型算法/工程/应用的全栈建模,选型,设计,研发,和优化,端到端解决风险防控问题,通过各种创新(如黑产对抗的强化学习,防控特征/策略的生成,面向对抗的多模态算法/系统设计和优化等),用智能化突破现有风险对抗体系的上限,保障支付宝的每一个客户的资金安全,为每一次支付保驾护航。
蚂蚁国际全球技术AI智能部正在寻找有激情并且具有创新能力的算法专家,通过使用AI 特别是生成式人工智能技术,推动蚂蚁国际化业务的发展。蚂蚁集团是一家AI驱动的公司,国际化是蚂蚁集团的重点方向,在这个职位上,你有机会接触到互联网金融,人工智能,国际化这3个当前最热门领域。 国际AI智能部负责大模型算法的创新应用与落地,同时也负责蚂蚁国际的 AI 基础设施和应用平台的建设。我们正在寻找热爱大模型的优秀人才加入我们。 其中,金融 AI 与大模型应用平台团队负责蚂蚁国际的金融 AI 业务,如基于大模型的金融助理在海外钱包的落地,以及蚂蚁国际的 AI 平台与基础设施建设,通过更加高效的训练和推理能力,以及结合 Agent 的平台研发助力蚂蚁国际全面拥抱生成式人工智能达成 AI 为先的战略。 1.负责大模型技术前沿技术跟踪、创新和落地。负责文本以及多模态大模型算法研发,对图片语音文本进行跨模型理解和生成。通过大模型算法创新和优化,致力提升大模型算法的场景落地和业务增效; 2.负责研发知识增强大语言模型技术,包括大模型领域适配、知识对齐、知识增强等,深入挖掘垂直行业、开源以及蚂蚁的海量数据,构建行业知识库,以支持相关技术的蚂蚁国际各个业务中的持续创新和实践应用; 3.负责垂直领域大模型算法开发,通过持续预训练和多任务模型微调,提升垂直大模型的核心技术价值和平台化落地; 4.深度参与产品研发项目,与团队成员合作,共同推动人工智能技术在实际业务中的应用和落地; 5.深入跟踪调研大语言模型以及相关方向(包括但不限于LLM/多模态等)的前沿技术,并适时进行技术分享。推动相关领域技术创新,进行专利申请和学术文章发表。
我们是蚂蚁集团平台工程与技术风险部,在这里可以应用最前沿的AI技术,实践最扎实的工程平台,参与前沿技术创新,包括代码智能(Code Intelligence)、智能体应用(LLM & Agents)、云原生(Cloud Native)、平台工程(Platform Engineering)、可观测(Observability)等,在双11等海量高并发的极端技术挑战下,构建下一代智能化工程架构。 团队秉承创新精神,在支持业务落地的同时推动技术进步。近三年来,我们在人工智能、软件工程、编程语言等领域的CCF A顶级会议上发表了40余篇论文,并两次获得蚂蚁集团技术最高奖T-Star及一次SuperMA大奖。我们的开源项目CodeFuse在GitHub上已获得超过8,000颗星标(截至2025年2月),并在Hugging Face和ModelScope上的模型累计下载量超过200万次。团队最新的Ling-Coder-Lite开源一周就获得3000+的下载,受到业界广泛认可。 参与蚂蚁集团的 AI 基础设施、平台、应用全栈系统的高可用设计,打造全球领先 AI 原生系统智能容灾与稳定性范式。 方向一、大模型系统韧性架构 - 突破分布式训练中的动态容错与自愈技术,保障超大规模参数模型的持续稳定性 - 构建多模态大推理场景下的智能容灾体系,实现服务能力的无损迁移与快速恢复 方向二、AI-Native 稳定性科学 - 研发大模型驱动的故障预测与决策系统,建立AI系统的自我诊断与修复能力 - 攻克异构算力环境下的服务一致性难题,设计自适应资源调度框架 方向三、前沿探索与范式革新 - 推进LLM与系统架构的深度协同,重构AI全栈系统的可靠性理论体系
蚂蚁集团分布式计算Ray团队,以跟加州伯克利大学RISELAB实验室合作开发的开源分布式计算引擎Ray(https://github.com/ray-project/ray)为通用底盘,打造下一代大规模分布式AI计算基础设施与生态。我们承载了蚂蚁200w+核的在线和离线AI计算任务,支撑着公司内大模型在线服务、在线机器学习、函数计算、离线推理、搜索推荐、图计算、多媒体计算、运筹优化等多种业务场景。 1. 负责AI计算引擎Ray从「通算」到「智算」场景的系统演进; 2.探索Ray及其AI生态在企业内部创新与落地,为公司AI应用发展提供Infra支持; 3.积极参与到Ray开源社区,通过讨论、文档撰写、代码贡献等形式推动Ray在AI及分布式计算领域的发展与创新。