蚂蚁金服蚂蚁集团-大模型评测工程师-蚂小财
社招全职3年以上技术类-开发地点:北京状态:招聘
任职要求
1.本科及以上学历,计算机相关专业,计算机&金融交叉学科优先; 2.Java/python编程扎实,具备大型分布式系统开发及架构经验; 3.有股票、财富管理相关背景优先考虑,有大模型应用项目经验优先考虑; 4.熟悉互联网开发流程、用户运营体系,具备数据化运营、用户洞察思维者优先; 5.积极向上,有较强的表达和沟通能力,具备很强的分析问题和实际解决问题的能力,抗压能力强。
工作职责
1.负责智能理财助理相关质量保障工作,拆解评估对象,深入评估模型,设计评测指标,制定评测方案,自动化评测能力建设及指标解读归因; 2.建设通用的基于大模型场景下的模型评估体系、评测框架及基础评测能力的建设,包括评测集完备性,合理性建设,评测结果智能化判定。
包括英文材料
学历+
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
分布式系统+
https://www.distributedsystemscourse.com/
The home page of a free online class in distributed systems.
https://www.youtube.com/watch?v=7VbL89mKK3M&list=PLOE1GTZ5ouRPbpTnrZ3Wqjamfwn_Q5Y9A
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
相关职位
社招3年以上技术类-开发
1.以大模型为代表的AI技术能力的建设和优化,打造业界领先的AI技术系统。主要职责包括AI系统结构设计,大模型训练数据构建,大模型能力评测,大模型推理效果和效率优化等; 2.紧密跟踪、探索大模型方向前沿技术,依托丰富且体系化的业务生态,实践大模型等AI技术在金融领域的应用与落地。 3.负责智能理财助理-蚂小财的产品研发,为上亿用户提供专业有温度的智能理财服务; 4.负责系统架构规划与设计,技术难题攻关,解决各类潜在系统技术风险,保障系统的安全、稳定、快速运行。
更新于 2025-09-15
社招技术类-算法
1.负责基于大模型及NLP算法,在股票证券专业性应用技术方面的技术研究与应用工作,深入探索如何利用大模型技术,为用户回答关于「股票证券分析、投资决策等」问题,提供更精准、更高效的解决方案; 2.参与金融智能相关项目的算法设计与开发,包括但不限于智能理财助理蚂小财、金融供给、Copilot、投研及投顾观点生成等; 3.负责金融大模型(如知识注入、对齐等)算法的研究和应用落地; 4.积极探索技术前沿领域,鼓励并支持将技术研究成果沉淀为论文和专利。
更新于 2025-07-24
社招3-5年D13923
1、负责大模型(包括不限于T2V、I2V、MLLM模型)评测工作和评测体系建设,包括设计制定和完善评测方案、评测指标、评测数据收集和更新、评测执行,并输出专业评测报告; 2、参与评测相关自动化评测工具开发及维护,最大化提高评测效率; 3、以算法手段,对基座大模型和AI Native应用进行分阶段、端到端评测; 4、参与构建评测Agent工具链、对战平台、模型竞技场、模型效果判别模型、应用数据飞轮等工具链建设; 5、站在用户角度,对产品、算法发提出建设性的意见,在评测参与的各个流程中以用户视角保证产品体验。
更新于 2025-08-11