logo of sensetime

商汤智算云-IaaS开发工程师(计算/存储/网络)

社招全职1-5年后端开发地点:北京 | 上海状态:招聘

任职要求


1. 计算机、软件工程、通信或相关专业,本科及以上学历,1~5年相关开发经验;
2. 熟悉Linux系统内核机制,具备扎实的计算机基础(操作系统、网络、存储等);
3. 熟悉以下至少一个技术领域:
· 虚拟化或容器技术(KVM、DockerK8sOpenStack、VirtIO、CNI等);
· 分布式存储系统(CephHDFS、GlusterFS、NVMe-oF等);
· 网络编程与优化(TCP/IP、RDMA、DPDK、eBPF、SDN等);
4. 熟悉至少一…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


【我们提供】
1. 参与商汤自研智算云平台的底层核心研发,直接支撑大模型训练与AI基础设施建设;
2. 面对百亿参数级模型和超大规模集群的技术挑战,积累独特的工程经验;
3. 优秀的工程文化与导师机制,快速成长为系统架构师或平台负责人;
4. 行业内具竞争力的薪酬与晋升发展通道。

【岗位关键词】
IaaS / 云计算 / 分布式系统 / 存储 / 网络 / 容器 / Kubernetes / Ceph / RDMA / eBPF / OpenStack / 智算云 / AI基础设施

【岗位职责】
作为商汤科技智算云核心基础设施团队成员,您将参与构建和优化支撑大规模AI训练与推理的IaaS底层平台,打造高性能、高可靠的云计算基础能力。主要工作包括:
一、计算方向:
1. 负责虚拟化/容器化计算资源调度系统的设计与开发(KVM、Docker、Kubernetes、OpenStack等)。
2. 优化GPU/CPU混合集群的资源利用率、任务调度和性能隔离机制。
二、存储方向:
1. 参与高性能分布式存储系统(Ceph、HDFS、NVMe over Fabrics等)的研发与优化。
2. 负责对象存储、块存储的性能调优与稳定性保障。
三、网络方向:
1. 设计并开发高性能虚拟网络系统,支持大规模AI训练与推理流量场景。
2. 参与SDN、RDMA、DPDK、eBPF 等前沿网络技术的研发与落地。
持续推进系统性能优化与架构演进,支撑智算中心规模化运营。
包括英文材料
学历+
Linux+
内核+
Docker+
Kubernetes+
OpenStack+
Ceph+
HDFS+
网络编程+
TCP/IP+
还有更多 •••
相关职位

logo of jd
社招运维工程师岗

1. 负责建设和维护京东公有云平台,进行日常配置管理、线上变更、监控报警及故障响应等工作; 2. 负责公有云平台线上稳定性工作,确保达到业界领先的SLA水平; 3. 根据业务发展要求,做好容量规划与集群性能优化工作,在低成本、高性能、高弹性等方向上提供运营决策参考; 4. 参与平台运维体系建设工作,最大限度的实现运维工作自动化,建设符合云平台特点的自动化运维平台。

更新于 2025-06-18北京
logo of aliyun
社招3年以上云智能集团

1、深入理解阿里云AI智算集群的技术原理、架构和使用场景,根据客户需求,设计并实施高性能、可扩展的AI基础设施解决方案,核心聚焦于大模型的训练与推理场景,促进商业化合作达成。 2、具备良好的架构思维,能够从稳定性、高性能、易用性、可用性、可运维性等方面综合考虑,基于阿里云IaaS和PaaS的全栈AI基础设施,确保从算力、网络、存储的极致优化,持续为客户提供高质量AI基础设施服务。 3、面向国际市场,总结分析AI智算发展趋势/市场竟争格局,主动挖掘行业数据和客户商机,建立可复制的行业解决方案,与产研团队紧密配合,推动产品能力和营收持续增长。 4、具备需求拆解和整合的能力,成为对内外部AI智算技术的传播者,能够将复杂的AI基础设施技术转化为清晰的商业价值,成为客户和内部团队信赖的技术顾问。 5、作为领域专家参与客户Workshop、市场洞察等活动,并在行业峰会、技术沙龙等市场活动中进行阿里云AI智算技术传播和分享。

更新于 2025-11-26北京|杭州
logo of aliyun
社招6年以上云智能集团

1. 支持广东政企客户售前业务拓展,结合阿里云产品、技术和服务等优势,面向区域客户建立技术影响力,提供云计算、AI大模型、智算等解决方案与产品。 2. 深刻理解客户需求,为客户提供业务和技术层面的架构咨询服务,提供基于阿里云技术体系的架构设计方案,支持客户或合作伙伴在阿里云IAAS、PAAS、MAAS上构建应用系统和服务。 3. 与销售团队和交付团队紧密配合,合力支撑售前、维护客户关系并建立技术信任,在和友商的竞争中以综合能力胜出,拿到业务结果。 4. 与产品研发团队合作,传递市场需求,共同研发或完善满足特定行业,特定应用场景的产品和解决方案。 5. 支持阿里云混合云复杂项目运作,带领产品和服务团队进行技术、业务验证,参与项目投标流程、合同签约等工作。

更新于 2025-11-25深圳|广州
logo of tencent
社招3年以上腾讯云-计算产品

1.深度研究 AI 技术趋势,结合腾讯云分布式云的产品架构与特点,设计分布式云与腾讯云全栈AI能力的融合,以满足客户在本地化场景下的智算需求,推动产品在 AI 领域的差异化竞争; 2.通过与客户、销售团队及行业专家紧密沟通,精准挖掘客户对于本地化智算的 AI 需求,将其转化为具体的产品功能特性。依据市场反馈和用户需求,持续优化分布式云与 AI 融合的产品功能,提升产品的用户体验和市场竞争力; 3.协同研发、算法、测试等多部门团队,确保 AI 相关功能在分布式云产品中的顺利集成与迭代。制定项目计划,明确各阶段目标与交付物,有效把控项目进度,及时解决项目推进过程中的技术难题与跨部门协作问题,保障产品按时、高质量交付; 4.参与产品的市场推广活动,向客户、合作伙伴及行业媒体清晰阐述分布式云与 AI 融合产品的价值与优势,提升产品知名度与影响力。为销售团队提供专业的技术支持,协助其开展客户拓展与项目投标工作,处理客户在使用过程中的技术咨询与问题反馈。

更新于 2025-09-12深圳