
商汤大装置-大模型工程开发工程师
任职要求
1-3 年后端代码设计、开发经验,包括但不限于Go/C/C++/C#/Java,熟悉其最佳实践和设计模式。 有在可拓展后端服务及微服务架构中工作的实践经验。 能够处理并发编程,具备在高并发场景中优化系统的能力。 熟悉容器化…
工作职责
开发并维护高可用,易扩展的后端服务 优化后端服务的性能和可扩展性,分析并解决系统中的性能瓶颈。 设计和实现高效的 API 以及微服务架构,支持复杂的业务逻辑需求。 与前端、算法、DevOps 以及其他后端团队密切合作,共同推动技术解决方案的落地。

商汤大装置部门目前在寻找一个可以将人工智能训练、推理数据高效处理能力工程化的人,这个人需要能理解AII大模型研究员开发的一些工具,主要focus在数据清洗、处理以及生产等,并将这些工具有机结合起来工程化为一个产品体系。 1、基于公司在人工智能大模型数据体系的积累,将现有产品、内部工具和技术能力梳理融合,形成标准解决方案对外赋能 2、和客户高效沟通,挖掘客户在数据方面的需求以及技术关键点,结合标准方案和研发技术创新,设计技术方案并推动落地 3、带领技术团队,完成标准解决方案的开发和项目的交付工作

1. 负责MaaS平台的功能测试、接口测试、自动化测试体系建设; 2. 设计并实现模型推理、训练、评估等流程的自动化验证机制; 3. 搭建端到端测试框架,提升测试效率与覆盖率; 4. 与平台研发、算法、运维等团队紧密协作,推动产品质量持续提升; 5. 深度参与模型性能测试与混沌测试,评估系统在高负载与异常场景下的稳定性; 6. 支持 CI/CD 流水线集成测试脚本,保障版本交付质量。

大装置智能云,支撑从云基础设施到大模型服务的完整产品体系。 欢迎加入测试开发团队,与我们一起打造下一代 AI 基础设施质量标准。 参与商汤大装置智能云核心产品的质量保障,包括: 1. 云平台方向(Cloud) · 云服务、容器平台(K8s)、网络/存储服务的功能与稳定性测试 · 自动化测试、接口测试、性能测试、系统级测试 2. 算力平台方向(Compute) · 多集群 GPU/NPU 算力池、调度平台的测试开发 · 压测、稳定性测试、异常场景验证 3. 大模型平台方向(AI Infra / MaaS) · 大模型推理、训练、评估平台的测试 · 模型性能测试、多模态模型验证、推理链路端到端自动化 4. 测试自动化,CI/CD 方向 · 测试框架、测试工具开发 · CI/CD 构建链路优化与集成 我们会根据你的能力与兴趣匹配到最合适的产品线。

你将参与构建和演进公司 MaaS 推理基础设施,支撑多模态大模型在多集群环境下的高效、稳定与低成本运行,具体包括: 1. 参与或主导 推理网关与核心服务 的设计与开发,支持多模态请求处理、流式推理、Micro-batch 调度等能力。 2. 参与 跨集群服务发现、健康检查与流量治理,提升推理系统的可用性与弹性。 3. 构建和优化 推理系统的可观测性能力,包括日志、指标、Tracing 以及基础成本与性能分析。 4. 针对 低延迟、高吞吐、高 GPU 利用率 等目标,参与系统性能优化与问题排查。 与算法、平台、硬件等团队协作,持续优化推理系统在性能、成本与稳定性上的整体表现。 5. 根据经验级别,逐步或直接承担 技术方案设计、系统演进决策、复盘与优化推动 等职责。 我们会根据候选人能力与经验,在具体职责深度和影响范围上进行匹配。