logo of antgroup

蚂蚁金服蚂蚁集团-测试开发专家-大模型训练推理-杭州/北京Z

社招全职3年以上技术类-质量保证地点:北京 | 杭州状态:招聘

任职要求


1. 3-5 年测试工作经验,有 AI/计算/存储引擎/基础设施质量工作背景,有白盒测试、性能测试、混沌工程测试经验。
2. 具备 AI 基础设施或大数据计算存储或大规模分布式系统测试经验,或有 AI/大数据计算/存储相关技术背景,了解业内常见 AI 训练推理引擎大数据计算存储引擎者优先。
3. 熟练掌握Java/C++/Python或其他脚…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责蚂蚁 AI 基础设施中推理、后训练、管控面链路、AI 存储等关键基础设施的质量保障工作,面向重点项目中的业务压力与挑战,补位项目不确定模块/组件的质量保障工作。
2. 主导项目全链路质量保障和风险识别工作,搭建质量技术保障体系、制定质量保障规范、推进测试工作执行。与项目中多角色、多合作团队形成积极有效的沟通和互动,驱动问题解决,保障交付质量。
3. 主动创新,通过技术手段解决质量保障工作中的复杂技术问题,提升测试效能、加深质量工作技术积累。
包括英文材料
大数据+
分布式系统+
推理引擎+
Java+
C+++
还有更多 •••
相关职位

logo of aliyun
社招3年以上云智能集团

1. 负责大模型训练、推理、评测、部署等核心链路的质量保障体系建设。 2. 设计并实现自动化评测框架,支持多维度(如准确性、一致性、安全性、推理速度等)的模型能力评估。 3. 构建高质量、可扩展的评测数据集,制定科学、可量化的评测标准与指标体系。 4. 推动CI/CD流程在大模型工程中的落地,保障模型迭代的稳定性与可回溯性。 5. 主导Bad Case分析闭环机制,联动算法、工程与业务团队优化模型表现。

更新于 2026-04-06北京|杭州
logo of aligenie
社招3年以上

1. 负责大模型训练、推理、评测、部署等核心链路的质量保障体系建设。 2. 设计并实现自动化评测框架,支持多维度(如准确性、一致性、安全性、推理速度等)的模型能力评估。 3. 构建高质量、可扩展的评测数据集,制定科学、可量化的评测标准与指标体系。 4. 推动CI/CD流程在大模型工程中的落地,保障模型迭代的稳定性与可回溯性。 5. 主导Bad Case分析闭环机制,联动算法、工程与业务团队优化模型表现。

更新于 2026-04-06北京|杭州
logo of aliyun
社招5年以上云智能行业解决方

1、深入理解客户业务需求,帮助客户选择适合其业务场景的技术路径和产品组合,利用AI技术知识、架构方法、咨询技能来影响客户技术决策 2、与客户合作进行模型训练、推理和模型应用等POC,含展示功能、调整模型、优化模型性能、测试分析、Agent搭建、模型调用等内容 3、依据客户需求和技术研判,推动产研部门持续优化产品,助力提升产品竞争力,同时沉淀最佳实践,以及脚本、模板、参考架构等可复用的技术资产 4、持续跟踪行业动态和技术趋势,并与产品团队协作,打造创新的人工智能(大模型、智算、一体机等)解决方案 5、支持市场活动,作为领域专家参与市场洞察、行业标准、市场排名报告、白皮书撰写等活动,并在行业峰会、技术沙龙等市场活动中进行技术传播和分享

更新于 2025-06-16北京|杭州|上海
logo of aliyun
社招5年以上云智能集团

1. 负责算力引入的前置测试,主要包含整机压测,部件性能测试,多机训练/推理单集群多品牌机器混部场景测试。 2. 负责算力引入GPU软硬件结合的疑难故障&性能问题分析和解决。 3. 负责GPU压测,监控,故障诊断工具开发和优化。 4. 负责主流模型和应用在新异构系统上的性能评测和分析。 5. 负责分析大规模LLM在训练和推理中面临的的AI异构硬件系统瓶颈,提出面向未来的AI异构系统架构建议,以支撑更高效的LLM扩展。

更新于 2025-11-26北京|杭州