
库洛游戏技术中心 - 后端开发工程师(AI平台方向)
任职要求
1、本科及以上学历,计算机相关专业,三年以上工作经验,一年以上AI应用开发相关经验; 2、熟练掌握Python、Java编程语言,具备扎实的软件工程设计能力,能够高效编写清晰、可维护的代码; 3、有大规模分布式系统设计和优化经验,能够处理高并发、高可用性场景; 4、熟悉常见基础设施和中间件,如Linu…
工作职责
1、负责企业内部AI平台的建设、维护和持续演进,支撑业务团队落地Agent、知识问答、流程自动化等企业AI场景的解决方案; 2、负责平台插件、MCP Server、连接器等服务组件的设计、开发和部署,打通内部系统、业务API、数据库、知识库以及消息通知等链路; 3、负责平台治理与规范建设,包括工具设计框架、服务发布规范、日志体系搭建、服务质量监控告警等方面; 4、保持与产品、业务方等人员的紧密沟通,思考通用能力的建设,沉淀可复用组件和标准化方案,提高研发交付效率和质量; 5、协助AI平台的测试验收工作,参与故障排查,并推动平台在性能和稳定性上的持续提升。
工作职责: 1. 负责贝壳C端的后端服务设计与开发,保障高并发场景下的系统稳定性; 2. 参与推荐引擎、模型预测、向量检索等基础系统、平台的设计、研发及调优工作,构建高并发推荐在线服务; 3. 深度参与数据工程开发,优化数据链路,构建离线特征,进行数据归因分析,协助推荐相关的用户画像的工程化建设; 4. 从业务中提取需求,抽象并优化现有系统,以提升效率并降低成本; 5. 关注性能、微服务、设计模式,提升用户体验; 6. 研究和应用新的算法技术,不断优化和改进现有的系统。

【我们提供】 1. 参与商汤自研智算云平台的底层核心研发,直接支撑大模型训练与AI基础设施建设; 2. 面对百亿参数级模型和超大规模集群的技术挑战,积累独特的工程经验; 3. 优秀的工程文化与导师机制,快速成长为系统架构师或平台负责人; 4. 行业内具竞争力的薪酬与晋升发展通道。 【岗位关键词】 IaaS / 云计算 / 分布式系统 / 存储 / 网络 / 容器 / Kubernetes / Ceph / RDMA / eBPF / OpenStack / 智算云 / AI基础设施 【岗位职责】 作为商汤科技智算云核心基础设施团队成员,您将参与构建和优化支撑大规模AI训练与推理的IaaS底层平台,打造高性能、高可靠的云计算基础能力。主要工作包括: 一、计算方向: 1. 负责虚拟化/容器化计算资源调度系统的设计与开发(KVM、Docker、Kubernetes、OpenStack等)。 2. 优化GPU/CPU混合集群的资源利用率、任务调度和性能隔离机制。 二、存储方向: 1. 参与高性能分布式存储系统(Ceph、HDFS、NVMe over Fabrics等)的研发与优化。 2. 负责对象存储、块存储的性能调优与稳定性保障。 三、网络方向: 1. 设计并开发高性能虚拟网络系统,支持大规模AI训练与推理流量场景。 2. 参与SDN、RDMA、DPDK、eBPF 等前沿网络技术的研发与落地。 持续推进系统性能优化与架构演进,支撑智算中心规模化运营。

【我们提供】 1. 参与商汤自研智算云平台的底层核心研发,直接支撑大模型训练与AI基础设施建设; 2. 面对百亿参数级模型和超大规模集群的技术挑战,积累独特的工程经验; 3. 优秀的工程文化与导师机制,快速成长为系统架构师或平台负责人; 4. 行业内具竞争力的薪酬与晋升发展通道。 【岗位关键词】 IaaS / 云计算 / 分布式系统 / 存储 / 网络 / 容器 / Kubernetes / Ceph / SDN / RDMA / DPDK / eBPF / OpenStack / 智算云 / AI基础设施 【岗位职责】 作为商汤科技智算云核心基础设施团队成员,您将参与构建和优化支撑大规模AI训练与推理的IaaS底层平台,打造高性能、高可靠的云计算基础能力。主要工作包括: 一、计算方向: 1. 负责虚拟化/容器化计算资源调度系统的设计与开发(KVM、Docker、Kubernetes、OpenStack等)。 2. 优化GPU/CPU混合集群的资源利用率、任务调度和性能隔离机制。 二、存储方向: 1. 参与高性能分布式存储系统(Ceph、HDFS、NVMe over Fabrics等)的研发与优化。 2. 负责对象存储、块存储的性能调优与稳定性保障。 三、网络方向: 1. 设计并开发高性能虚拟网络系统,支持大规模AI训练与推理流量场景。 2. 参与SDN、RDMA、DPDK、eBPF 等前沿网络技术的研发与落地。 3. 在物理网络与 Fabric 层,通过工程化与自动化方式支撑云网络平台能力。 持续推进系统性能优化与架构演进,支撑智算中心规模化运营。