蚂蚁金服研究型实习生-结构化表格数据建模以及模型自更新相关技术研究
实习兼职研究型实习生地点:上海 | 杭州状态:招聘
任职要求
研究领域: -目前正在攻读计算机科学或相关STEM领域的硕士或博士学位 -具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScript或Go -具有上述研究领域的相关经验,包括行业经验或作为参与实验室研究 优先录用: -对技术研究充满热情,具有产生新思想和创新的能力; 在自学,问题分析和解决方面表现出色 -在国际会议上或核心期刊发表一份或多份出版物或论文 -至少3个月的全职工作
工作职责
研究领域: 人工智能 项目简介: 随着黑产技术的不断演进和变化,传统的资金风控模型每隔一段时间都会面临着显著的性能衰退问题。具体而言:首先,黑产不断尝试新的攻击手段;其次,基于固定时间窗口的数据训练模型容易受到数据分布漂移的影响,导致模型效果随时间推移而下降。同时,使用最新数据进行模型迭代训练时,新模型会忘记老的知识,使得在某些情况下新模型的表现可能不如旧模型,需要在迭代过程中保留对历史风险模式的记忆。因此,如何构建一个能够持续学习,适应风险攻防形势,同时保持对历史风险记忆的风控模型,成为了当前亟待解决的问题。 同时,近期基础大模型能力的不断提升,也给资金风控智能化带来新的机会。除了传统的基于结构化数据的建模可用于线上实时风险识别之外,大语言模型也可以消费更多非结构化数据信息并进行逻辑分析与推理,可以与传统的分类模型互为补充,大幅提升现有风险防控水平。 本项目分两个方向:(1)方向一:将聚焦于持续学习、迁移学习、样本曝光偏差处理、Tabular 数据建模等关键技术方向,预期开发出一种风控模型的自适应学习方案。该方案使得风控模型可以能够在面对不断变化的风险环境时,通过迭代保持高性能和高稳定性,避免性能衰退,更准确地识别和应对新兴的欺诈、赌博、洗钱和盗用等风险行为,减少误报率,提高用户体验,从而提升整体风控识别水平和管控效率;(2)方向二:将聚焦强化学习、监督微调等大模型后训练技术,不断提升大模型在资金风控领域的分析、推理能力,预期开发出一套模型微调方案,能够将风控知识高效注入到大模型当中,最终用于资金风险案例分析与防控。
包括英文材料
学历+
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
C+
https://www.freecodecamp.org/chinese/news/the-c-beginners-handbook/
本手册遵循二八定律。你将在 20% 的时间内学习 80% 的 C 编程语言。
https://www.youtube.com/watch?v=87SH2Cn0s9A
https://www.youtube.com/watch?v=KJgsSFOSQv0
This course will give you a full introduction into all of the core concepts in the C programming language.
https://www.youtube.com/watch?v=PaPN51Mm5qQ
In this complete C programming course, Dr. Charles Severance (aka Dr. Chuck) will help you understand computer architecture and low-level programming with the help of the classic C Programming language book written by Brian Kernighan and Dennis Ritchie.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
JavaScript+
https://developer.mozilla.org/zh-CN/docs/Learn_web_development/Core/Scripting
[英文] Learn JavaScript
https://learnjavascript.online/
The easiest way to learn & practice modern JavaScript
[英文] Learn JavaScript
https://web.dev/learn/javascript
https://www.youtube.com/watch?v=zuKbR4Q428o
Write bulletproof JavaScript code with unit testing!
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
相关职位
实习研究型实习生
研究领域: 人工智能 项目简介: 多模态训练数据存在噪声与知识密度低的问题,导致模型存在严重幻觉,以及靠低效的样本堆量来学习知识。在对多模态素材抽取图文实体,构造结构化数据后,进一步关联知识图谱,可以获取关于实体的知识和关系标签,用于探索对多模态任务的知识扩充、数据生成和图片/视频-知识对齐新训练范式的研究。
实习阿里云研究型实习
面向数据库结构化数据和文件系统非结构化数据,设计并实现一站式的高性能存储底座,优化海量存储场景下元数据库性能,具体研究内容包括但不限于: 1.基于数据库的大规模PB级别数据文件系统的文件metadata管理; 2.支持AI训练和推理的并行文件系统和数据库系统的性能优化; 3.数据库结构化数据和文件系统非结构化数据一站式融合和数据流动、索引构建和检索; 4.跨云并行文件系统。
更新于 2025-07-02
实习阿里云研究型实习
1.研发融合结构化查询与向量检索的混合执行引擎; 2.设计基于深度学习的索引参数自优化框架; 3.开发分布式环境下的动态负载均衡算法; 4.构建多维度查询性能评估指标体系。
更新于 2025-07-02