蚂蚁金服【蚂蚁星】大模型数据合成工程师

校招全职蚂蚁星计划 - Plan A地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 计算机、数学、AI相关专业硕士、博士；
2. 技术能力：熟练使用Python，掌握主流深度学习框架（PyTorch/TensorFlow）；
3. 相关模型实战和研究经验（具备任一即可）：…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

作为蚂蚁集团核心安全数据中枢，我们构建金融级全域智能安全防御体系，深耕风险防控、数据资产保护、网络攻防对抗、内容生态治理等关键领域。依托EB级全域安全数据资产与万亿级实时计算能力，为集团数字支付、数字互联生态、数金业务矩阵（网商银行、财富管理、保险科技）、数字科技输出及全球化业务提供全链路安全赋能。
我们依托先进的大数据分析技术和机器学习算法，深度挖掘数据中潜藏的风险与威胁，通过智能预测与主动防御机制，实现安全事件的精准识别与快速响应。持续追踪前沿技术发展，整合大数据、大模型和AI生成技术，成功打造了规模超千亿的多模态安全训练数据集。这些高质量数据集已成为集团大模型安全基础训练语料，广泛应用于大模型安全防御、大模型去毒及身份核验等关键安全领域。加入我们，你将有机会投身于前沿技术的研发与应用，亲身探索全球领先的科技创新成果。我们不仅提供行业领先的薪酬福利体系，更致力于为你营造专业、开放且富有活力的工作氛围。如果你对安全技术与数据应用怀有热忱，渴望在充满创新机遇与专业挑战的环境中实现职业成长，我们诚挚邀请你加入安全大数据技术团队！让我们携手共建智能安全新未来！
1.参与大模型预训练数据、sft数据、指令、CoT数据等样本处理计算和加工；
2.负责设计开发创新性数据合成算法，优化大模型训练中的高维稀疏数据表征与长尾分布处理；
3.负责搭建多模态数据生成工厂，探索文本、代码、图像的语义对齐与高质量合成，负责多模态数据分析与融合：处理文本、图像、音频等多模态数据，研发高效算法实现数据语义融合与精确解析；
4.设计先进的对抗式数据增强技术，提升噪声过滤精度并突破数据清洗瓶颈；
5.研究基于合成数据的大模型迭代机制，推动模型持续进化与提升性能。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Python+

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

蚂蚁集团-JAVA技术专家（实物电商）-支付宝技术

社招技术类-开发

1. 营销阵地C端玩法架构设计与实现，在快速迭代中沉淀抽象以提升研发效率 2. 电商导购心智产品建设与迭代，用数据、技术驱动业务效果提升 3. 支撑大促活动，解决高并发高难度技术课题，协同上下游落地跨团队项目，并保障项目稳定 4. 推荐系统迭代与调优，构建多维度策略能力，提升整体推荐分发效率与效果

更新于 2025-07-21杭州

蚂蚁集团-客户端基础技术专家（医疗+小程序）-支付宝技术

社招2年以上技术类-开发

方向一：客户端平台：iOS/Android 方向二： 1.客户端基础框架的定制、开发、优化。 2.Web技术研发，移动端跨端动态技术研发，包括生态语言、渲染技术方向三： 1.面向支付宝客户端iOS/Android平台的智能化基础设施建设，赋能端内各业务场景； 2.负责端侧计算引擎的架构设计与开发，增强对用户的理解； 3.负责端云共享学习、在线学习等领域的技术体系建设； 4.负责终端大模型框架与应用落地 5.强烈责任心和团队合作精神，乐于探索未知领域。

更新于 2025-04-03北京|上海|杭州

蚂蚁集团-数据科学专家-北京

社招3年以上技术类-数据

1、与业务需求结合，设计并落地创新型实验及准实验，提升实验的效率和洞察深度，探索机器学习技术、动线挖掘、模型预测等方法在因果推断中的应用场景，解决观测数据中因果关系的识别，研发新型因果推断方法，优化业务决策； 2、从理解业务问题到因果因推断相关领域方法论研究、原型验证、直到与工程团队合作将成熟的技术产品化，推动方法从理论到实践的转化。设计可扩展的实验框架，支持大规模、多场景下的因果推算与效果评估； 3、负责通过AB实验设计、因果推断、深度学习等手段，量化运营策略效果和价值，科学评估运营手段，为业务决策提效。

更新于 2025-07-28北京

蚂蚁集团-JAVA研发专家-AI标注

社招3年以上技术类-开发

1.负责蚂蚁数据标注平台的开发、参与蚂蚁 AI 标注引擎的建设； 2.根据用户需求，进行平台产品的业务抽象、技术方案设计和实现； 3.有大流量高并发系统设计和性能调优经验为佳。

更新于 2025-04-03北京