logo of antgroup

蚂蚁金服蚂蚁集团-算法评测工程师-杭州/成都

社招全职3年以上技术类-开发地点:杭州 | 成都状态:招聘

任职要求


1. 三年以上互联网及传统行业开发测试和质量保障经验,具备一年以上AI/算法类产品的算法评测等测试经验(如大模型/推荐/搜索/NLP系统);
2. 对软件质量保障有体系化的思考和经验。能够面对复杂情况建立体系化的软件质量控制的策略和模型,并具备良好的落地实践;
3. 熟悉算法服务测试场景(如精度验证、AB实验评估等),精通至少一个测试领域(自动化/性能/安全);
4. 熟悉主流算法框架,熟练使用Python等编程语言,有测试工具平台开发经验;
5. 具备算法评测基础知识,熟悉常用评测指标(准确率/召回率/F1-score等),了解badcase分析及评测数据集构建等评测方法,有算法评测工程经验者优先;
6. 对新质技术敏锐度高,能快速理解AI产品特性,具备技术攻关和团队协作能力。

工作职责


1. 按照产品架构和业务要求,设计覆盖功能及非功能需求的质量保障策略,主要负责AI/算法类产品质量(如智能引擎、大模型应用);
2. 参与产品系统架构建设和规划,针对AI系统特性进行专项测试方案设计,保障系统稳定性;
3. 解决测试复杂技术问题,开发适配算法服务的测试工具(评测数据集构造、模型效果评估等),提升效能与品质;
4. 研究测试新技术方法,重点推进AI算法评测、AI原生应用测试能力升级等创新方向,攻克算法领域特有质量难题;
5. 能结合AI行业发展趋势,制定合适的质量技术发展规划,提升团队技术视野和技术影响力。
包括英文材料
算法+
大模型+
NLP+
Python+
相关职位

logo of antgroup
社招5年以上技术类-质量保证

方向一: 1. 参与平台研发的全过程,监督研发过程的关键点,包含:产品需求评审、技术评审、代码review,测试评审、变更发布验收。 2.负责平台的质量建设,包括测试需求分析、测试架构设计、质量管理、风险洞察与应对,持续深入的稳定性建设。 3. 根据测试需要,能够开发测试代码、脚本、工具。 4. 保证被测系统的质量,并能通过改善测试流程、方法、技能,提高测试效率和质量。 方向二: ucdp算法质量 1. 负责支付宝的个性化AI产品体验(包括但不限于搜索推荐与增长)以及 基于Gen AI技术构造下一代的智能化产品的质量保障工作; 2. 工作内容包括不限于持续集成,回归体系,质量工具开发,线上监控应急,算法评估评测等,推动架构、技术、工具和流程的改进和创新,多工种配合,提升整体研发和交付的效率; 3. 在技术架构、工具平台、团队技能和人员等方面进行有前瞻性的布局、规划和建设,构建高品质的稳定性保障能力,有质量技术方向的创新。

更新于 2025-06-20
logo of aliyun
社招5年以上诚云科技

1. 大模型PoC与Demo支持:执行方案评估,实施,演示,部署全过程,能够按照业务场景快速快速落地PoC项目。 2. 大模型需求分析:帮助客户理清大模型需求并转化为技术要求,对外控制客户需求,对内解决技术难题,保证项目的顺利落地和达效。 3. 跨部门协同:协调跨部门资源,组织算法或大模型产品团队进行技术研发、验证及部署工作,保证算法解决方案按时高质量交付。 4. 合作伙伴协同:管理合作伙伴技术方案和技术实现细节,解决项目的技术风险。

更新于 2025-09-19
logo of aliyun
社招2年以上诚云科技

1. 大模型PoC与Demo支持:执行方案评估,实施,演示,部署全过程,能够按照业务场景快速快速落地PoC项目。 2. 大模型需求分析:帮助客户理清大模型需求并转化为技术要求,对外控制客户需求,对内解决技术难题,保证项目的顺利落地和达效。 3. 跨部门协同:协调跨部门资源,组织算法或大模型产品团队进行技术研发、验证及部署工作,保证算法解决方案按时高质量交付。 4. 合作伙伴协同:管理合作伙伴技术方案和技术实现细节,解决项目的技术风险。

更新于 2025-09-18
logo of antgroup
校招蚂蚁集团2026

1.负责以大模型为代表的AI技术能力的建设和优化,打造业界领先的AI技术系统,主要职责包括AI系统结构设计、RAG 系统开发、大模型训练数据构建、大模型能力评测、大模型推理效果和效率优化等; 2.紧密跟踪、探索大模型方向前沿技术,依托丰富且体系化的业务生态,实践大模型算法的创新应用与落地。