阿里巴巴阿里国际站-AI 安全与风控算法工程师-杭州
任职要求
1、计算机、人工智能、信息安全等相关专业硕士及以上学历,具备 3 年以上深耕风控算法或 AI 安全领域的实战经验。 2、深度掌握 PyTorch/TensorFlow 等主流深度学习框架,熟悉大语言模型的对齐与防御机制,拥有丰富的大模型 Post-training 实战经验。 3、了解提示词工程 与 AI 对抗攻防技术,在越狱指令检测…
工作职责
1、参与阿里巴巴国际站及 Accio Work 平台的 AI 风险防控体系建设,负责 AI 风险检测与防御算法的研发与落地。 2、针对提示词注入、智能体劫持、AI合规侵权、数据投毒等新型风险,构建 Global AIGuard,实现全链路 AI 风险管理能力。 3、协助构建智能体操作审计与风险溯源系统,实现 AI 决策过程的可视化与可解释性,支持异常行为的快速定位与干预。 4、参与 AI 红队攻防演练,模拟黑灰产攻击手法,挖掘 AI 智能体潜在漏洞并提出修复方案,持续优化平台安全水位。 5、配合业务团队完成流量反作弊、市场治理、资金安全、合规侵权等场景的 AI 风控算法迭代,提升模型准确率与实时性。 6、持续跟踪 Safety Alignment、Privacy-Preserving AI 等 SOTA 研究,将学术前沿成果转化为业务生产力。
团队介绍:字节跳动安全与风控-Flow部门,负责Flow业务中大模型和生成式AI应用如豆包、Cici、扣子等的安全保障工作。团队为业务面临的数据安全、用户隐私挑战、新兴大模型攻击方式等安全隐患提供创新的防御能力和解决方案,我们在北京、杭州、深圳、圣何塞均设有安全研发中心,团队和业务正处于快速发展期,成长空间大,欢迎各位同学加入。 1、使命:提升大模型在安全领域的智能上限; 2、训练垂直大模型并应用到安全任务,如代码分析、漏洞检测、攻击研判、威胁情报、SDLC; 3、深度应用&创新大模型技术栈,如数据合成、模型后训练(SFT/GRPO/Agent)、模型加速与蒸馏等,探索技术边界。
团队介绍:字节跳动安全与风控-Flow部门,负责Flow业务中大模型和生成式AI应用如豆包、Cici、扣子等的安全保障工作。团队为业务面临的数据安全、用户隐私挑战、新兴大模型攻击方式等安全隐患提供创新的防御能力和解决方案,我们在北京、杭州、深圳、圣何塞均设有安全研发中心,团队和业务正处于快速发展期,成长空间大,欢迎各位同学加入。 1、针对大模型的各种安全问题进行建模,优化模型和产品工程,创新的解决风险; 2、针对有害内容,隐私脱敏,提示词攻击等威胁进行治理,策略运营提升召回精准,实现大模型防火墙的防护效果。
团队介绍:字节跳动安全与风控-Flow部门,负责Flow业务中大模型和生成式AI应用如豆包、Cici、扣子等的安全保障工作。团队为业务面临的数据安全、用户隐私挑战、新兴大模型攻击方式等安全隐患提供创新的防御能力和解决方案,我们在北京、杭州、深圳、圣何塞均设有安全研发中心,团队和业务正处于快速发展期,成长空间大,欢迎各位同学加入。 1、针对大模型的各种安全问题进行建模,优化模型和产品工程,创新的解决风险; 2、针对有害内容,隐私脱敏,提示词攻击等威胁进行治理,策略运营提升召回精准,实现大模型防火墙的防护效果。
蚂蚁集团大安全事业群机器智能团队致力于打造安全科技的核心竞争力,做可信AI的持续引领者,为广大支付宝用户的数字化生活提供全方位安全保障。作为蚂蚁集团安全版图中的核心力量,我们正以最前沿的AI算法为刃、以大模型为盾,编织数字世界的"安全之网"。在这里,大模型、智能体、AI安全等热门的研究不再是纸上谈兵,每一个方向都在落地成为真实业务场景、十亿级用户的智慧防线。 关于团队,过去获得过浙江省科技进步一等奖、中国电子学会科技进步一等奖,人工智能学会吴文俊人工智能自然科学奖一等奖,中国图象图形学学会科技进步一等奖、多次获得中国计算机学会科技进步奖、世界人工智能大会SAIL之星与"镇馆之宝",等多个重量级奖项。可信AI专利布局全球第一,主导制定ITU国际风控标准。多名Kaggle Grandmaster ,拿过多个KDD Cup/CVPR/NeurIPS/ICCV/CVPR/ECCV等多个顶会竞赛冠军,累计发表近百篇顶会论文; 在这里,你将有机会和毕业于海内外著名高校的行业专家们、众多KDD Cup/CVPR 等比赛冠军、Kaggle Grandmaster 、顶会论文作者们共同根植蚂蚁丰富的场景数据,利用海量算力探索创新前沿算法应用,使用领先的机器学习算法解决风控业务问题,构建数据与知识驱动的智能风控体系,提升用户的支付安全体验。 加入我们,让我们一起为世界带来微小而美好的改变。 1. 参与和负责针对对抗攻击、后门植入、数据泄露等内生安全威胁的主动防御机制; 2. 研发基于RL的大模型安全对齐技术; 3. 通过实时对抗攻防与安全态势感知实现防御策略的自主进化; 4. 探索模型训练推理全链路的可控性增强技术。