阿里巴巴集团安全部-强化学习/Agent算法工程师/专家-行为风控方向

社招全职3年以上2026-06-16地点：北京状态：招聘

扫码手机上打开

任职要求

1、硕士研究生及以上学历，计算机、人工智能、软件、信息安全、统计和数学专业优先；
2、3年以上大模型/强化学习相关研发经验，深刻理解RLHF/Agent训练经验；
3、具备业务风控领域（作弊、欺诈、账号安全、恶意行为等方向）的实战经验，对风险数据（日志、行为序列、用户画像、图数据）有敏锐的洞察…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

岗位面向行为风控这一高度复杂且动态对抗的业务场景，支持反爬、作弊、欺诈、账号安全、恶意行为等核心风控业务，聚焦大模型强化学习与Agent等核心技术，构建下一代智能风控基座和行业权威的行为域基模解决方案。
1、面向行为域的结构化/序列化/图表化数据体系，构建面向结构化数据的后训练和评测方案，产出行为特色的“世界模型”；
2、围绕行为风控的复杂任务，设计并迭代强化学习方案，包括但不限于：Reward System、RL、复杂决策、自我博弈等方向，构建全链路情报分析与风险决策能力；
3、面向行为分析、识别、挖掘、链路还原、路径推演等场景，设计可规模化扩展的Agent训练环境和迭代方案；

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

大模型+

强化学习+

RLHF+

还有更多 •••

登录查看完整学习资料