京东高级测试开发工程师（AI Infra）

社招全职5年以上测试开发岗2025-08-24地点：北京状态：招聘

扫码手机上打开

任职要求

1. 统招本科及以上计算机相关专业，5年以上软件测试工作经验。有HPC、云计算IAAS、大模型、大数据类项目经验优先；
2. 对Bug嗅觉灵敏，具备协助研发定位根因的能力，掌握项目涉及的整体系统架构并设计功能、稳定性、…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 负责京东云AI基础设施产品的质量保障工作，为上层AI开发提供高性能计算/网络、AI存储、大模型训练/推理、大数据开发等高质量底层技术产品；
2. 参与构建产品质量保障体系，根据产品需求、设计文档，制定测试计划，编写和执行测试用例，反馈问题，评价版本质量；
3. 参与自动化测试框架及测试pipeline建设，持续提高提测质量和测试效率。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

HPC+

IaaS+

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

Senior Cloud Infra Engineer 高级云计算基础架构工程师

社招3年以上

无

更新于 2025-08-01广州

高级 IaaS 研发工程师（J97206）

社招3年以上ACG

-参与 AI Infra 核心平台建设，支撑大模型训练与推理业务的稳定、高效运行，覆盖 GPU、RDMA、高速网络等算力资源在云原生体系中的统一管理与调度 -负责 GPU、RDMA 等 IaaS 资源的自动化准入、能力识别、基准测试与性能评测，建设标准化算力验收与持续评测体系，保障不同硬件规格在大规模集群下的可用性与一致性 -负责 Kubernetes 容器平台的架构设计、能力演进与稳定性治理，重点关注平台的高可用、稳定性、安全性、性能、可扩展性等非功能性指标，参与或主导调度、资源隔离、设备插件（GPU/RDMA）、网络或存储相关模块的设计与二次开发 -支撑大模型推理与训练业务在平台侧的工程化落地，关注推理与训练场景下的资源利用率、调度效率、显存管理与多租户隔离，与算法、引擎团队协作，推动性能优化能力在平台层的规模化复用 -参与多卡、多机、大规模 GPU 集群的资源调度与稳定性建设，支撑 TP/DP/PP/PD 等并行模式在平台侧的运行与管理，解决实际生产环境中的性能抖动、资源碎片化与容量规划问题 -参与运维与运营平台后端研发，支撑算力运营、性能监控、容量管理与成本治理，建设可观测体系（监控、日志、Tracing），推动问题发现与定位的自动化，通过工程化手段持续降低人工运维成本

更新于 2026-02-03深圳

高级测试开发工程师（AI Infra）

社招5年以上测试开发岗

我们是京东云，作为京东集团面向企业、政府等机构的技术服务品牌，是更懂产业的数智化解决方案提供商，致力于为企业、金融机构、政府等各类客户提供以供应链为基础的数智化解决方案。依托公、专、混的全栈式云产品矩阵，我们融合了人工智能、大数据、物联网等前沿科技，在零售、物流、健康、智能城市、金融科技等行业领域为客户提供了丰富的产品与数字化解决方案，帮助客户降低成本、提升效率，是值得信赖的产业数字合作伙伴。岗位职责： 1. 负责京东云AI基础设施产品的质量保障工作，为上层AI开发提供高性能计算/网络、AI存储、大模型网关、大模型训练/推理、大数据开发等高质量底层技术产品； 2. 深度使用AI技术构建产品质量保障体系，反馈问题，评价版本质量； 3. 参与自动化测试框架及测试pipeline建设，持续提高提测质量和测试效率。

更新于 2026-03-22

AI平台高级研发工程师（大模型专项）

社招3年以上机器学习平台

【业务介绍】我们是小红书内稠密类模型（LLM/MLLM/SD/CV/NLP）统一的AI平台QuickSilver，负责调度公司内所有稠密类模型训练与推理资源，基于自建的训推引擎，为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务；包括数据管理，模型管理，模型训练、压缩、推理、部署，服务管理，资源调度等一系列能力。工作职责： 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程，包括模型fine-tuning、推理服务化等 3、构建云原生架构，设计高可用、高性能的微服务体系 4、优化平台性能，提升系统稳定性和可扩展性

北京|上海|深圳