
商汤大装置-GPU硬件服务工程师
社招全职业务运维地点:北京状态:招聘
任职要求
1. 本科及以上学历,计算机相关专业。
2. 熟悉 CPU 和 GPU 平台架构,熟悉 Nvidia 或国产 GPU/NPU 的软硬件生态;
3. 熟悉 GPU 服务器系统拓扑,熟悉 RoCE/IB/NVLink 等训练集群常见的通信协议以及网卡配置;
4. 对于硬件产品的交付以及结合项目做硬件设备清单和组网方案设计有系统性、完整性的经验;
5. 具备…登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 负责 GPU 服务器的选型、准入测试和验收工作。 2. 分析 GPU 性能瓶颈并进行性能调优工作,定位并解决 GPU 和相关的硬件故障。 3. 负责构建稳定可靠的测试机制和测试系统,设计测试方案支撑上层业务系统。 4. 与产品研发团队协同配合,参与千卡/万卡集群互联的软硬件方案设计,解决新硬件和系统落地过程中的各类技术问题。 5. 持续跟进智算产业链的最新技术能力和硬件架构,设计出有竞争力的硬件解决方案,支持产品经理向客户输出硬件服务器的技术文档。 6. 结合 GPU 产品业务场景做成本和收益评估,确定技术方案以支撑算力迭代、资源折算、项目输出标准化方案制定等工作;
包括英文材料
学历+
内核+
https://www.youtube.com/watch?v=C43VxGZ_ugU
I rummage around the Linux kernel source and try to understand what makes computers do what they do.
https://www.youtube.com/watch?v=HNIg3TXfdX8&list=PLrGN1Qi7t67V-9uXzj4VSQCffntfvn42v
Learn how to develop your very own kernel from scratch in this programming series!
https://www.youtube.com/watch?v=JDfo2Lc7iLU
Denshi goes over a simple explanation of what computer kernels are and how they work, alonside what makes the Linux kernel any special.
还有更多 •••
相关职位

社招业务运维
1. 负责 GPU 服务器的选型、准入测试和验收工作。 2. 分析 GPU 性能瓶颈并进行性能调优工作,定位并解决 GPU 和相关的硬件故障。 3. 负责构建稳定可靠的测试机制和测试系统,设计测试方案支撑上层业务系统。 4. 与产品研发团队协同配合,参与千卡/万卡集群互联的软硬件方案设计,解决新硬件和系统落地过程中的各类技术问题。 5. 持续跟进智算产业链的最新技术能力和硬件架构,设计出有竞争力的硬件解决方案,支持产品经理向客户输出硬件服务器的技术文档。 6. 结合 GPU 产品业务场景做成本和收益评估,确定技术方案以支撑算力迭代、资源折算、项目输出标准化方案制定等工作;
更新于 2025-07-31

社招后端开发
你将参与构建和演进公司 MaaS 推理基础设施,支撑多模态大模型在多集群环境下的高效、稳定与低成本运行,具体包括: 1. 参与或主导 推理网关与核心服务 的设计与开发,支持多模态请求处理、流式推理、Micro-batch 调度等能力。 2. 参与 跨集群服务发现、健康检查与流量治理,提升推理系统的可用性与弹性。 3. 构建和优化 推理系统的可观测性能力,包括日志、指标、Tracing 以及基础成本与性能分析。 4. 针对 低延迟、高吞吐、高 GPU 利用率 等目标,参与系统性能优化与问题排查。 与算法、平台、硬件等团队协作,持续优化推理系统在性能、成本与稳定性上的整体表现。 5. 根据经验级别,逐步或直接承担 技术方案设计、系统演进决策、复盘与优化推动 等职责。 我们会根据候选人能力与经验,在具体职责深度和影响范围上进行匹配。
更新于 2026-02-11北京|杭州|上海