logo of antgroup

蚂蚁金服【蚂蚁星】大模型数据合成工程师

校招全职蚂蚁星计划 - Plan A地点:北京 | 杭州状态:招聘

任职要求


1. 计算机、数学、AI相关专业硕士、博士;
2. 技术能力:熟练使用Python,掌握主流深度学习框架(PyTorch/TensorFlow);
3. 相关模型实战和研究经验(具备任一即可):…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


作为蚂蚁集团核心安全数据中枢,我们构建金融级全域智能安全防御体系,深耕风险防控、数据资产保护、网络攻防对抗、内容生态治理等关键领域。依托EB级全域安全数据资产与万亿级实时计算能力,为集团数字支付、数字互联生态、数金业务矩阵(网商银行、财富管理、保险科技)、数字科技输出及全球化业务提供全链路安全赋能。
我们依托先进的大数据分析技术和机器学习算法,深度挖掘数据中潜藏的风险与威胁,通过智能预测与主动防御机制,实现安全事件的精准识别与快速响应。持续追踪前沿技术发展,整合大数据、大模型和AI生成技术,成功打造了规模超千亿的多模态安全训练数据集。这些高质量数据集已成为集团大模型安全基础训练语料,广泛应用于大模型安全防御、大模型去毒及身份核验等关键安全领域。加入我们,你将有机会投身于前沿技术的研发与应用,亲身探索全球领先的科技创新成果。我们不仅提供行业领先的薪酬福利体系,更致力于为你营造专业、开放且富有活力的工作氛围。如果你对安全技术与数据应用怀有热忱,渴望在充满创新机遇与专业挑战的环境中实现职业成长,我们诚挚邀请你加入安全大数据技术团队!让我们携手共建智能安全新未来!
1.参与大模型预训练数据、sft数据、指令、CoT数据等样本处理计算和加工;
2.负责设计开发创新性数据合成算法,优化大模型训练中的高维稀疏数据表征与长尾分布处理;
3.负责搭建多模态数据生成工厂,探索文本、代码、图像的语义对齐与高质量合成,负责多模态数据分析与融合:处理文本、图像、音频等多模态数据,研发高效算法实现数据语义融合与精确解析;
4.设计先进的对抗式数据增强技术,提升噪声过滤精度并突破数据清洗瓶颈;
5.研究基于合成数据的大模型迭代机制,推动模型持续进化与提升性能。
包括英文材料
Python+
深度学习+
还有更多 •••
相关职位

logo of antgroup
社招技术类-开发

1. 营销阵地C端玩法架构设计与实现,在快速迭代中沉淀抽象以提升研发效率 2. 电商导购心智产品建设与迭代,用数据、技术驱动业务效果提升 3. 支撑大促活动,解决高并发高难度技术课题,协同上下游落地跨团队项目,并保障项目稳定 4. 推荐系统迭代与调优,构建多维度策略能力,提升整体推荐分发效率与效果

更新于 2025-07-21杭州
logo of antgroup
社招2年以上技术类-开发

方向一: 客户端平台:iOS/Android 方向二: 1.客户端基础框架的定制、开发、优化。 2.Web技术研发,移动端跨端动态技术研发,包括生态语言、渲染技术 方向三: 1.面向支付宝客户端iOS/Android平台的智能化基础设施建设,赋能端内各业务场景; 2.负责端侧计算引擎的架构设计与开发,增强对用户的理解; 3.负责端云共享学习、在线学习等领域的技术体系建设; 4.负责终端大模型框架与应用落地 5.强烈责任心和团队合作精神,乐于探索未知领域。

更新于 2025-04-03北京|上海|杭州
logo of antgroup
社招3年以上技术类-数据

1、与业务需求结合,设计并落地创新型实验及准实验,提升实验的效率和洞察深度,探索机器学习技术、动线挖掘、模型预测等方法在因果推断中的应用场景,解决观测数据中因果关系的识别,研发新型因果推断方法,优化业务决策; 2、从理解业务问题到因果因推断相关领域方法论研究、原型验证、直到与工程团队合作将成熟的技术产品化,推动方法从理论到实践的转化。设计可扩展的实验框架,支持大规模、多场景下的因果推算与效果评估; 3、负责通过AB实验设计、因果推断、深度学习等手段,量化运营策略效果和价值,科学评估运营手段,为业务决策提效。

更新于 2025-07-28北京
logo of antgroup
社招3年以上技术类-开发

1.负责蚂蚁数据标注平台的开发、参与蚂蚁 AI 标注引擎的建设; 2.根据用户需求,进行平台产品的业务抽象、技术方案设计和实现; 3.有大流量高并发系统设计和性能调优经验为佳。

更新于 2025-04-03北京