
商汤大装置-大模型服务平台测试开发工程师
任职要求
1. 扎实的 Python 编程能力,熟练使用 Pytest、Unittest 等测试框架; 2. 至少2年及以上的测试经验,熟悉常见的测试类型,如接口测试、性能测试、稳定性测试; 3. 熟练使用 Linux,了解容器技术(Docker/K8s); 4. 熟悉至少一种大模型推理框架(如 Transformers、Diffusers、vLLM、TGI 等); 5. 有责任心、沟通协作能力强,善于跨团队合作解决问题。 加分项: 1. 有 LLM 测试经验,如 LLaVA / BLIP2 / InternLM-XComposer 等多模态模型; 2. 熟悉 Locust、JMeter 等负载测试工具; 3. 有混沌工程实战经验(如使用 Chaos Mesh); 4. 有大模型训练/微调/部署平台测试经验;
工作职责
1. 负责MaaS平台的功能测试、接口测试、自动化测试体系建设; 2. 设计并实现模型推理、训练、评估等流程的自动化验证机制; 3. 搭建端到端测试框架,提升测试效率与覆盖率; 4. 与平台研发、算法、运维等团队紧密协作,推动产品质量持续提升; 5. 深度参与模型性能测试与混沌测试,评估系统在高负载与异常场景下的稳定性; 6. 支持 CI/CD 流水线集成测试脚本,保障版本交付质量。

1. 参与MaaS平台的功能测试、接口测试、自动化测试体系建设; 2. 参与设计并实现模型推理、训练、评估等流程的自动化验证机制; 3. 参与搭建端到端测试框架,提升测试效率与覆盖率; 4. 与平台研发、算法、运维等团队紧密协作,推动产品质量持续提升; 5. 深度参与模型性能测试与混沌测试,评估系统在高负载与异常场景下的稳定性; 6. 支持 CI/CD 流水线集成测试脚本,保障版本交付质量。

我们正在寻找一位经验丰富、技术全面的 大模型框架产品测试工程师(QA),负责保障公司AI框架产品的高质量交付。 该岗位需要候选人具备出色的沟通表达能力、抗压能力和执行力,同时拥有复杂系统的端到端测试经验以及对机器学习和大模型领域的深刻理解。 您将与研发团队紧密合作,设计并实施高效的测试策略,确保产品的功能、性能和稳定性达到行业领先水平。 主要职责 1. 测试策略制定:参与产品需求分析,制定端到端测试计划,设计测试用例,并执行功能测试、性能测试和兼容性测试。 2. 自动化测试开发:使用 Python、Shell 等编程语言,开发和维护自动化测试框架及脚本,提升测试效率。 3. 质量保障:识别潜在的质量风险,推动问题解决,确保产品在不同环境下的稳定性和可靠性。技术研究:深入理解机器学习、大模型及相关技术栈,探索新的测试方法和技术工具。 4. 团队协作:与开发、产品经理和其他部门高效沟通,确保测试工作的顺利推进。 5. 结果汇报:定期向上级和利益相关方清晰汇报测试进展和质量问题。

团队介绍 商汤科技国产化团队致力于将行业领先的AI大模型技术与国内自主创新的算力基础设施深度融合。团队负责打通从底层异构芯片到上层大模型应用的全链路,构建高效、稳定、自主的AI生产力平台。加入我们,你将有机会与顶尖的技术专家合作,定义和打造适配国产算力生态的下一代AI产品,亲身参与并引领这场波澜壮阔的技术变革。 岗位职责 1. 市场与技术洞察: 深入研究和分析国产异构算力芯片的技术路线、生态发展及市场趋势;深刻理解主流大模型(LLM、多模态等)的技术架构、训练与推理范式。 2. 产品规划与定义: 负责大装置在国产化算力上的适配与优化产品规划。主导需求分析,撰写高质量的产品需求文档(PRD),清晰定义产品功能、性能指标、验收标准及技术边界。 3. 项目推动与协同: 作为产品负责人,与算法、AI框架、底层硬件优化、测试及业务团队紧密合作,拉通端到端的产品研发流程,确保产品按时、高质量交付。 4. 技术方案对齐: 深度参与技术方案讨论,能够从产品视角出发,对模型适配、算子开发、编译优化、推理部署等关键技术环节提出建设性意见,确保技术方案最大化满足产品和市场需求。 5. 生态合作与赋能: 与国内主流芯片厂商、服务器厂商及重要客户建立技术交流渠道,传递产品价值,收集核心需求,共同推动国产AI生态的繁荣。 6. 产品生命周期管理: 负责产品的全生命周期管理,持续跟进产品上线后的表现,收集用户反馈,并基于数据和反馈驱动产品的迭代优化。