
商汤大装置-虚拟化与DPU卸载工程师
任职要求
1. 本科及以上学历,计算机及相关专业。 2. 5年以上软件开发经验,至少3年虚拟化相关经验; 3. 熟悉 KVM、QEMU 等技术; 3. 熟悉 DPU 软硬件生态; 4. 熟悉 I/O 虚拟化技术,了解 VirtIO、VFIO、IOMMU、SR-IOV 等技术; 5. 熟悉 DPDK、SPDK 等技术; 6. 熟悉 Docker、Kubernetes 等技术; 7. 编码功底扎实,善于独立思考; 8. 有较强的自我驱动能力和学习能力,具备良好的沟通能力和跨团队协作经验。 加分项: 1. 有在生产环境中针对虚拟化、裸金属、容器等场景卸载经验者优先; 2. 有实际落地经验者优先; 3. 有社区贡献经历者优先; 4. 有容器安全生产实践经验者优先。
工作职责
1. 负责软硬件结合的虚拟化、裸金属以及容器环境生态支持,以 DPU 重新定义下一代数据中心,构建更先进的 AI Infra 底座; 2. 负责 Hypervisor、计算节点 控制面 和 数据面 卸载方案的制定与生产实践落地; 3. 负责 NVIDIA BlueField 和其他国产 DPU 的卸载工作,提供完整的虚拟化技术方案,配合计算、网络、存储、安全产品完成整体卸载工作; 4. 负责虚拟化底层技术的性能优化以及稳定性建设, 通过技术手段提升节点资源利用率,持续降低基础设施成本; 5. 参与云原生方向容器安全技术架构的设计、研发,负责公有云和私有云等多云场景下容器安全的落地。

1、负责智算行业解决方案专项任务,能够基于市场反馈和项目实践,完善解决方案,并输出产品优化建议与迭代方向,推动产品与市场之间的闭环联动,持续提升产品竞争力与市场适配性; 2、掌握智算行业市场动态及趋势,引导客户对智算业务的理解和认知,协助商务推进业务落地,包括但不限于方案策略、市场判断、客户关系判断、高层谈判等; 3、具备在“AI+云”新兴业务及行业领域的解决方案拓展能力,能够深入理解并梳理行业需求,结合产品特性制定可落地的整体解决方案和产品形态; 4、协调内外部机构,能够拉通产线、商务以及周边支撑职能,以全流程视角实现解决方案落地,保障业务高效流转。

1. 作为高级解决方案经理,能够承担某一场景/行业解决方案专项任务,输出面向客户的解决方案规划设计; 2. 深刻理解公司产品体系,能够基于项目实践持续深耕,不断丰富完善解决方案,强化解决方案竞争力; 3. 结合对市场端以及竞争态势洞察,探索“AI+云”新业务新市场机会,能够由模糊的市场端输入提炼出体系化、规范化细化需求,向内输出产品改进以及优化建议,推动产品与市场闭环流转,促进产品竞争力提升; 4. 有一定项目管理能力以及全局视角工作把控能力;能够拉通内部产线、前场销售以及周边支撑职能,充分形成内部合力,以全流程视角实现解决方案落地,保障业务高效流转; 5. 配合前场销售推进业务拓展,对项目进行有效技术管理以及客户满意度维护,实现方案落地,保障项目拓展目标达成。

我们正在寻找一位经验丰富、技术全面的 大模型框架产品测试工程师(QA),负责保障公司AI框架产品的高质量交付。 该岗位需要候选人具备出色的沟通表达能力、抗压能力和执行力,同时拥有复杂系统的端到端测试经验以及对机器学习和大模型领域的深刻理解。 您将与研发团队紧密合作,设计并实施高效的测试策略,确保产品的功能、性能和稳定性达到行业领先水平。 主要职责 1. 测试策略制定:参与产品需求分析,制定端到端测试计划,设计测试用例,并执行功能测试、性能测试和兼容性测试。 2. 自动化测试开发:使用 Python、Shell 等编程语言,开发和维护自动化测试框架及脚本,提升测试效率。 3. 质量保障:识别潜在的质量风险,推动问题解决,确保产品在不同环境下的稳定性和可靠性。技术研究:深入理解机器学习、大模型及相关技术栈,探索新的测试方法和技术工具。 4. 团队协作:与开发、产品经理和其他部门高效沟通,确保测试工作的顺利推进。 5. 结果汇报:定期向上级和利益相关方清晰汇报测试进展和质量问题。

1. 负责 GPU 服务器的选型、准入测试和验收工作。 2. 分析 GPU 性能瓶颈并进行性能调优工作,定位并解决 GPU 和相关的硬件故障。 3. 负责构建稳定可靠的测试机制和测试系统,设计测试方案支撑上层业务系统。 4. 与产品研发团队协同配合,参与千卡/万卡集群互联的软硬件方案设计,解决新硬件和系统落地过程中的各类技术问题。 5. 持续跟进智算产业链的最新技术能力和硬件架构,设计出有竞争力的硬件解决方案,支持产品经理向客户输出硬件服务器的技术文档。 6. 结合 GPU 产品业务场景做成本和收益评估,确定技术方案以支撑算力迭代、资源折算、项目输出标准化方案制定等工作;