logo of dewu

得物【技术保障】资深基础设施SRE

社招全职3-5年技术类地点:上海状态:招聘

任职要求


1.本科学历及以上,3-5年以上基础设施相关运维经验
2.熟练使用Linux系统,至少能掌握Python/Shell/GO等一至两种语言,有项目开发经验者优先
3.精通X86服务器硬件组件/子系统CPU,Disk,Memory,内核,熟悉分布式存储等优先;
4.熟悉服务器厂商售后及机房现场管理。
5.有丰富的…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责公司线上及线下基础设施相关运维,提升系统稳定性和运维效率;
2.公有云/IDC资源相关需求受理及交付管理,负责各业务中短期和特殊资源需求的接收、分析、规划匹配、建设、交付跟进;
3.负责服务器、存储、基础服务等Iaas/Paas层技术评估、监控、调优、诊断及软硬件优化和故障定位分析;
4.评估硬件功能方案、基于新产品的运维场景下、完善各个过程的新产品适配可用维保障;
5.负责设备生命周期自运营维护;
6.完善运维过程的硬件/系统的技术方案输出和标准化
包括英文材料
学历+
Linux+
Python+
Bash+
还有更多 •••
相关职位

logo of dewu
社招技术类

职位描述 1. 定位为资深AI Infra Arch,在AI算力基础设施、AI推理和训练框架全栈底层技术方面有丰富经验技术,可带领团队建设AI平台,助力CV/NLP/AIGC/社区/搜广推等算法业务场景提升效率,加速AI能力向业务效果的转换。 2. 负责设计研发得物AI平台,对AI算力相关相关资源(GPU/TPU/CPU、存储、网络等)做平台化管理,持续提升资源利用率,为业务提供一个满足企业级稳定性和性能要求的AI平台。 3. 负责训练和推理引擎优化,助力各算法业务场景提升模型迭代效率、提高推理服务性能。 4. 解决规模增长带来的技术和业务问题。 5. 解决多云场景下的AI算力资源、数据资源的管理问题,以及业务使用效率问题,目标是降本提效。

更新于 2023-12-26杭州
logo of momenta
社招

更新于 2024-12-30北京|苏州
logo of papergames
社招5年以上平台类

1、承担 DevOps 平台的架构设计与优化工作,推动运维基础设施和运维体系的建设; 2、负责 DevOps 平台的研发与落地实施,包含但不限于微服务、容器、CI/CD、自动化测试、静态代码分析、环境治理等方面; 3、负责游戏云原生技术体系的搭建; 4、推进运维流程规范化和制度建设,并通过工具研发落地到游戏业务和平台业务,提升研发和运维效率; 5、研发运维工具和相关技术保障系统,提升团队的研运一体水平。

更新于 2025-12-19上海
logo of aliyun
社招8年以上诚云科技

1.组织集群各种基础设施规范标准、技术优化、⻛险管控等方案的编制及评审,并做好相关记录 2.跟进全国规范标准、技术优化、⻛险排查的落地进度,并及时推动落地不及时的情况 3.审核并优化电气专业系统的SOP、EOP、MOP以及SCP⽂件 4.审核并优化电气专业系统的巡检表单、维护计划、维护内容、演练计划与⽅案等⼯作内容 5.对集群⽤电情况分析总结 6.负责数据中⼼运⾏数据的分析、设备标准⼯况分析和参数设定指导 7.节能优化提⾼设备的综合效能、采取有效措施提升设备保障能⼒ 8.对在运⾏数据中⼼出现的电⽓问题进⾏故障定位,根因分析并在技术上支撑问题快速解决; 9.及时总结复盘并横向拉通进⾏经验分享,更新相关运维标准、规范

更新于 2026-01-23南通|杭州|张家口