logo of antgroup

蚂蚁金服蚂蚁集团-大模型评测工程师-平台架构

社招全职技术类-开发地点:杭州状态:招聘

任职要求


基本要求:
1.计算机科学相关领域,扎实的java编程基础、中间件等相关技术;
2.了解机器学习深度学习大模型基础知识,在其中一个领域有深入理解;
3.具备领域建模能力,有过独立架构或者承担过核心系统系分的经验,能够独挡一面;
4.较强的表达和沟通能力,较强的学习能力,对技术有热情,工作认真、严谨、敬业、有责任心。…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责大模型基座或智能体评测方法、评测Benchmark、评测平台的建设;
2.使用统计、机器学习技术来分析模型输出,识别模式和潜在问题,编写技术报告,总结评测结果和提出改进建议;
3.跟踪最新的AI评测技术和工具,并将其集成到我们的评测流程中;
4.与算法专家和工程师团队合作,了解模型的功能和限制;紧跟业务,确保评测结果能够指导产品迭代和优化。
包括英文材料
Java+
中间件+
机器学习+
深度学习+
大模型+
Hadoop+
还有更多 •••
相关职位

logo of antgroup
社招技术类-开发

1.负责以大模型为代表的AI技术能力的建设和优化,打造业界领先的AI技术系统。主要职责包括AI系统结构设计,大模型训练数据构建,大模型能力评测,大模型推理效果和效率优化等; 2.紧密跟踪、探索大模型方向前沿技术,依托丰富且体系化的业务生态,实践大模型等AI技术创新应用与落地。

更新于 2025-07-23杭州
logo of kuaishou
社招3年以上D2863

1、负责大模型相关的评测和标注平台研发,协同产品、QA、算法做好模型评测相关的工作; 2、参与模型评测方案的制定和评测数据集建设,搭建自动化的评测链路; 3、建设高效率、易使用的平台,不断优化系统架构,支撑业务规模增长,保障业务稳定。

更新于 2025-02-12北京
logo of alibaba
社招3年以上技术类-数据

1、参与大模型数据平台架构设计与开发,为大模型数据资产建设管理提供平台支持,支持数据资产上架、知识生产、检索、训练应用等;数据用途上包含预训练数据、微调数据、评测数据等,数据模态上包含文本、图片、视频、音频等各类模态数据。 2、参与高可用、可扩展、分布式大模型评测平台架构设计与开发,支持多模型、多方法、多评测集的评测任务执行、评测结果分析,优化评测框架,提升评测效率,支持实现大模型快速迭代的评测要求。 3、在通用BenchMark基础上构建业务领域Benchmark,围绕“语料供给-模型迭代-模型评测”的链路不断优化链路,提升生产效率。 4、持续的创新和优化能力,提升产品整体质量,改善用户体验。

更新于 2025-06-30杭州
logo of meituan
社招2年以上核心本地商业-基

负责美团基础大模型评测框架和周边生态的开发、维护和能力拓展。 支持文本、多模态、Agent、应用等多个方向的评测框架和平台开发工作。 协同支持整个大模型平台从数据到训练到评测的基础架构标准化建设。 协同开源评测社区建设,打造业界一流的评测框架体系。

更新于 2025-05-12北京|上海