logo of antgroup

蚂蚁金服【蚂蚁星】大模型数据科学家

校招全职蚂蚁星计划 - Plan A地点:北京 | 杭州状态:招聘

任职要求


1. 计算机、数学、统计学、人工智能相关专业硕士/博士;
2. 精通Python及主流数据科学工具(如PandasNumPy),掌握深度学习框架(PyTorchTensorFlow)。掌握基本统计分析方法(分布分析、假设检验、相关性分析等)。熟悉数据科学评估框架(ROC曲线、Precision/Recall、AUC等)与机器学习算法。熟悉A/B实验体系;
3. 相关经验(任一即可):
1)评估数据的质量与数据偏差,建立优化流程与指标体系;
2)开发基于数理统计或博弈论的创新数据价值评估方法;
3)实现数据驱动的决策分析模型,辅助产品迭代与性能提升。
4. 加分项:顶会论文、有开源项目经验或参与知名竞赛并获奖。

工作职责


作为蚂蚁集团核心安全数据中枢,我们构建金融级全域智能安全防御体系,深耕风险防控、数据资产保护、网络攻防对抗、内容生态治理等关键领域。依托EB级全域安全数据资产与万亿级实时计算能力,为集团数字支付、数字互联生态、数金业务矩阵(网商银行、财富管理、保险科技)、数字科技输出及全球化业务提供全链路安全赋能。

我们依托先进的大数据分析技术和机器学习算法,深度挖掘数据中潜藏的风险与威胁,通过智能预测与主动防御机制,实现安全事件的精准识别与快速响应。持续追踪前沿技术发展,整合大数据、大模型和AI生成技术,成功打造了规模超千亿的多模态安全训练数据集。这些高质量数据集已成为集团大模型安全基础训练语料,广泛应用于大模型安全防御、大模型去毒及身份核验等关键安全领域。加入我们,你将有机会投身于前沿技术的研发与应用,亲身探索全球领先的科技创新成果。我们不仅提供行业领先的薪酬福利体系,更致力于为你营造专业、开放且富有活力的工作氛围。如果你对安全技术与数据应用怀有热忱,渴望在充满创新机遇与专业挑战的环境中实现职业成长,我们诚挚邀请你加入安全大数据技术团队!让我们携手共建智能安全新未来!
1.负责设计先进数据评估方法:创建科学指标体系与测量工具,评估数据质量、贡献度与分布特性,为AI模型优化提供明确方向。研究数据的重要性与影响,探索动态数据价值量化技术(如Shapley值、类边际贡献算法);
2.负责数据驱动决策支持:利用统计学、机器学习与实验设计方法,构建逻辑推演与预测模型,提供数据洞察与业务指导;
3.大规模数据优化:从海量数据中发现异常模式与长尾现象,开发动态数据增强与去噪技术,突破数据复杂性极限;
4.前沿应用研究:探索自监督学习、强化学习等前沿技术领域的数据应用,将数据科学引入学术与工业无人区。
包括英文材料
Python+
数据科学+
Pandas+
NumPy+
深度学习+
PyTorch+
TensorFlow+
机器学习+
算法+
相关职位

logo of antgroup
校招蚂蚁星计划 -

1.参与人维度决策大模型的应用‎研发和效果优化; 2.‎研发、探索SFT/RLHF方向前沿算法、框架,持续提升现有算法的效率与效果。; 3.对现有模型进行性能优化,包括提升推理速度、降低计算资源消耗等; 4.收集、清洗、标注、合成增强等方式构建大规模数据集,用于模型训练。

logo of antgroup
校招蚂蚁星计划 -

蚂蚁集团技术研究院致力于做有用、有想象力的科研,负责探索下一代前沿科技,帮助蚂蚁构建更具竞争力和可持续性的技术生态。 蚂蚁技术研究院数据智能实验室专注于通过下一代数据创新深化AGI前沿,这里汇聚了一群对人工智能充满热情的极客、科学家和工程师,核心成员累计学术引用量过万。 实验室拥有​​顶级资源支持​​包括但不限于海量高质量训练数据(万亿级Token,覆盖多领域、多模态);超大规模算力(万卡级GPU集群,支持分布式训练与高效调优);与全球顶尖AI团队(如DeepMind、OpenAI等)的深度合作机会等。 你将参与​: - 下一代AGI大模型研发     a. 探索更高效的训练架构     b. 突破现有模型的推理与泛化能力     c. 研究多模态、因果推理、强化学习等前沿方向 - 构建新数据范式     a. math/code数据饱和后的后训练时代数据     b. 合成数据,突破全球可用数据上限     c. 多模态数据,构建空间数据与跨模态任务的核心引擎 - 技术创新与开源     a. 撰写高质量技术论文,推动学术边界     b. 构建开源工具链,降低AGI研发门槛     c. 与全球开发者社区互动,分享你的成果

logo of antgroup
校招2026届蚂蚁星

蚂蚁集团技术研究院致力于做有用、有想象力的科研,负责探索下一代前沿科技,帮助蚂蚁构建更具竞争力和可持续性的技术生态。 蚂蚁技术研究院数据智能实验室专注于通过下一代数据创新深化AGI前沿,这里汇聚了一群对人工智能充满热情的极客、科学家和工程师,核心成员累计学术引用量过万。 实验室拥有​​顶级资源支持​​包括但不限于海量高质量训练数据(万亿级Token,覆盖多领域、多模态);超大规模算力(万卡级GPU集群,支持分布式训练与高效调优);与全球顶尖AI团队(如DeepMind、OpenAI等)的深度合作机会等。 你将参与​: - 下一代AGI大模型研发     a. 探索更高效的训练架构     b. 突破现有模型的推理与泛化能力     c. 研究多模态、因果推理、强化学习等前沿方向 - 构建新数据范式     a. math/code数据饱和后的后训练时代数据     b. 合成数据,突破全球可用数据上限     c. 多模态数据,构建空间数据与跨模态任务的核心引擎 - 技术创新与开源     a. 撰写高质量技术论文,推动学术边界     b. 构建开源工具链,降低AGI研发门槛     c. 与全球开发者社区互动,分享你的成果

logo of antgroup
校招蚂蚁星计划 -

我们是大安全基础安全部,负责守护蚂蚁集团数据安全,并对抗内外部网络威胁。我们专注于企业核心数据资产保护与安全治理,保护用户及商家的数据安全。在数据全生命周期防护、防勒索、攻防演练、资产认知、威胁情报等领域具有深厚积累,致力于构建自主可控的数据安全防护与治理体系。 我们在基础安全领域站在行业前沿,一直引领行业能力标准与最佳实践经验,利用大数据、AI技术持续变革和创新安全运营体系。团队里有顶尖的攻防、算法与平台技术大拿。加入我们,与我们共同定义AI时代的新一代数据安全防护体系。 作为大模型数据安全领域的奠基者,从理论到实践打造下一代AI安全标准,引领行业发展方向,具体包括: 1. 突破传统安全边界,构建跨模态、多Agent交互环境下的全新安全模型,前瞻性定义AI系统安全的关键指标与评估体系; 2. 构建Agent时代的数据治理框架,确保从训练到推理全生命周期的数据合规与安全,构建AI应用可信环境; 3. 对抗安全与鲁棒性强化,研究大模型在不同模态下的安全对齐技术,解决幻觉、越权与越界行为等核心挑战,提升模型在复杂攻击下的稳定性。