logo of jd

京东测试开发专家

社招全职5年以上测试开发岗地点:北京状态:招聘

任职要求


1. 五年以上测试开发经验,对业务理解、测试分析和设计、测试开发和执行具备一定的认知和实践深度;
2. 三年以上算法测试或AI产品评测经验,至少完整主导过1个AI产品评测项目;
3. 有团队指导经验,过往如果有AI评测相关的知识传承和流程规范化建设的优秀案例是很大的加分项;
4.熟悉业界主流、前沿的模型、Agent效果和性能评测的方法论和工具链;
5.优秀的逻辑分析能力,能针对模型和Agent失效场景提出可解释的归因结果和分析过程;
6.了解模型部署、Agent开发流程、SF…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


我们是京东科技的核心B端企业服务团队,致力于探索和构建下一代企业服务。我们不仅拥有行业TOP级的灵工平台和持续增长的私域营销产品,更将目光投向由AI驱动的企业应用。
岗位职责:
一、负责给模型和Agent构建效果和性能评测体系、沉淀评测方法论、引入和建设AI评测工具链;
1. 模型效果和性能(部门部署和维护的大语言模型和多模态模型等);
2. 垂类Agent(客服、质检、财税等垂类);
3. 业务工具类Agent(解决既有业务特定场景的问题);
二、与算法、产品、研发团队深度协同,参与AI产品全生命周期质量保障,推动评测结果驱动产品迭代;
三、定期组织分享和培训、提升部门对AI产品评测的整体认知和能力。
包括英文材料
算法+
AI agent+
还有更多 •••
相关职位

logo of xiaohongshu
社招3年以上机器学习平台

【业务介绍】 作为公司统一的机器学习平台团队,负责调度公司所有模型训练与推理资源;基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。 【岗位职责】 1、负责机器学习链路,离在线数据相关的开发工作,包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作;包括样本平台,特征平台,训练平台,推理平台等AI应用后台建设等; 3、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。

上海
logo of didi
社招5年以上技术

滴滴出行国际化金融测试团队,负责核心业务质量保障,包括支付、风控、现金贷、信用卡等业务,团队技术导向,紧跟公司业务,质量保障能力处在行业前沿水平。 1、负责国际化支付系统的核心链路测试架构工作; 2、负责金融域内质量保障体系的构建和实践; 3、参与前线调研,负责前线业务对接,打通国际前线和质量Team信息渠道,消灭认知GAP、赋能国际金融业务 4、通过前瞻性的能力、机制建设, 规避业务质量风险;

更新于 2025-03-19北京
logo of ke
社招3年以上质量架构部

1.参与基于多模态大模型的GUI智能化能力的设计开发,实现多端(web/安卓/ios/鸿蒙/小程序)大模型手眼配套能力全覆盖; 2.跟踪业界前沿技术发展,参与大模型应用评测、企业内部场景化落地、GUI智能体建设等;

更新于 2025-03-27北京
logo of ke
社招3年以上基础业务质量组

1.负责业务质量保证工作,包括需求分析评审、测试计划制定、用例设计与执行、缺陷的跟踪和问题定位、项目质量风险把控等 2.针对业务痛点质量风险、线上问题分析,推进业务质量过程持续改进 3.自动化用例开发维护,性能测试脚本编写及执行,运用工具提高测试效率

更新于 2025-03-21北京