logo of sensetime

商汤大装置-集群运维开发工程师(容器方向)

社招全职3年以上业务运维状态:招聘

任职要求


1. 本科及以上学历,计算机及信息等相关专业优先,3年以上运维开发或集群运维经验,具备大规模生产环境下的Kubernetes运维经验
2. 熟悉 shellgo 语言,具备go开发经验,能够编写高效的自动化脚本和工具
3. 对中间件有丰富的运维部署或开发经验,如PostgreSQL、Ka…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责公司K8S集群及中间件集群的可靠、稳定、高效运行,对系统中存在的问题进行汇总与分析,提出改进意见与建议。
2. 负责SRE体系及规范的建设与落地,在保证用户使用体验和稳定性的前提下,推动运维体系朝着云原生化的方向发展,持续改进整个系统的管理和运行效率,不断提升资源利用率。
3. 关注业界前沿容器及中间件相关技术动态,探索云原生技术的发展方向,推动新技术在团队中应用落地,提升整体技术水平。
包括英文材料
相关职位

logo of sensetime
校招技术开发类

方向一:系统运维开发工程师 1.负责开发、测试或生产环境中服务器和应用系统的管理与监控,确保系统的稳定运行; 2.使用夜莺、Prometheus、Grafana等工具进行实时监控和数据分析,及时发现和解决潜在问题。 方向二:容器运维开发工程师 1. 协助公司K8s集群及中间件集群的运维; 2. 协助自动化平台、工具的落地开发; 3. 参与云原生技术的调研。

更新于 2025-10-11北京|上海
logo of sensetime
社招安全攻防

1、在授权下,对系统、网络、服务器、App应用端等进行渗透测试、安全测试、漏洞挖掘; 2、负责安全事件应急响应工作,包括应急响应流程建设、应急演练、应急处理、复盘总结,对入侵事件进行溯源; 3、针对渗透测试发现的问题,撰写安全评估报告,提出修改建议和缓解措施,推动问题闭环; 4、研究业界最新的渗透测试技术及方法,对于现有防御体系覆盖不到的新型风险具备发现能力,保持渗透测试的有效性和前瞻性; 5、参与新系统上线前的安全评审,从渗透角度给出有效安全设计建议。

更新于 2026-01-13北京|上海
logo of sensetime
社招业务运维

1. 负责 GPU 服务器的选型、准入测试和验收工作。 2. 分析 GPU 性能瓶颈并进行性能调优工作,定位并解决 GPU 和相关的硬件故障。 3. 负责构建稳定可靠的测试机制和测试系统,设计测试方案支撑上层业务系统。 4. 与产品研发团队协同配合,参与千卡/万卡集群互联的软硬件方案设计,解决新硬件和系统落地过程中的各类技术问题。 5. 持续跟进智算产业链的最新技术能力和硬件架构,设计出有竞争力的硬件解决方案,支持产品经理向客户输出硬件服务器的技术文档。 6. 结合 GPU 产品业务场景做成本和收益评估,确定技术方案以支撑算力迭代、资源折算、项目输出标准化方案制定等工作;

更新于 2025-07-31
logo of sensetime
社招5年以上业务运维

本岗位隶属于 SRE 团队,负责智算集群与科研级基础设施中的 Underlay 物理网络交付与稳定性保障。 Underlay 网络作为云网络(Overlay)的底座能力,为上层 SDN、容器网络和算力平台提供高可靠、低时延、可预测的网络基础。 你将作为 SRE 体系下的 物理网络工程师,面向大规模、高稳定性要求的集群场景,承担 Underlay 网络的规划、交付与运行保障: 1. 负责智算/云计算集群 Underlay 物理网络的规划设计、部署交付与持续优化,包括网络拓扑、设备选型、配置与调试。 2. 负责交换机、路由器、防火墙等网络设备的配置、变更与日常运维,保障网络稳定运行。 3. 参与集群网络的 上线、扩容、升级与迁移,确保对上层 Overlay 网络和业务影响可控。 4. 监控网络运行状态,参与网络值班,快速定位并处理物理网络层面的故障与异常。 5. 与 云网络 / SDN / Overlay 团队协作,支持其在 Underlay 之上的网络能力建设与问题排查。 6. 编写和维护网络相关文档,包括网络拓扑、配置说明、运维手册、故障复盘等。 7. 持续研究数据中心与智算网络相关技术,推动 Underlay 网络在稳定性、可扩展性和运维效率上的演进。

更新于 2025-12-31北京|上海