logo of alibaba

阿里巴巴集团安全部-强化学习/Agent算法工程师/专家-行为风控方向

社招全职3年以上地点:北京状态:招聘

任职要求


1、硕士研究生及以上学历,计算机、人工智能、软件、信息安全、统计和数学专业优先;
2、3年以上大模型/强化学习相关研发经验,深刻理解RLHF/Agent训练经验;
3、具备业务风控领域(作弊、欺诈、账号安全、恶意行为等方向)的实战经验,对风险数据(日志、行为序列、用户画像、图数据)有敏锐的洞察…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


岗位面向行为风控这一高度复杂且动态对抗的业务场景,支持反爬、作弊、欺诈、账号安全、恶意行为等核心风控业务,聚焦大模型强化学习与Agent等核心技术,构建下一代智能风控基座和行业权威的行为域基模解决方案。
1、面向行为域的结构化/序列化/图表化数据体系,构建面向结构化数据的后训练和评测方案,产出行为特色的“世界模型”;
2、围绕行为风控的复杂任务,设计并迭代强化学习方案,包括但不限于:Reward System、RL、复杂决策、自我博弈等方向,构建全链路情报分析与风险决策能力;
3、面向行为分析、识别、挖掘、链路还原、路径推演等场景,设计可规模化扩展的Agent训练环境和迭代方案;
包括英文材料
学历+
大模型+
强化学习+
RLHF+
还有更多 •••