logo of ctrip

携程资深IaaS基础设施工程师/专家(MJ026963)

社招全职技术团队开发地点:上海状态:招聘

任职要求


1. 计算机/电子工程/网络工程相关专业,本科及以上学历;
2. 深入理解云计算架构,熟悉OpenStack/KVM等IaaS核心技术,具备虚拟化平台兼容性测试经验;
3. 掌握基础设施关键技术栈:服务器固件管理(BMC/IPMI)、虚拟化网络(OVS); 
4. 熟练使用Ansible等自动化工具,具备Python/Go开发能力实现自动化运维解决方案; 
5. 具备优秀的故障定位能力和良好的技术文档输出能力,善于团队协作并适应跨地域/跨时区工作环境;

工作职责


1. 主导云计算基础设施全生命周期质量体系建设,制定覆盖虚拟化/网络/存储性能、稳定性及多平台兼容性测试策略;
2. 负责下一代数据中心架构的建设,了解业界动态,包括主流服务器(如CPU、内存、硬盘、RAID卡、网卡、GPU卡等)配置的测试选型推荐; 
3. 协同架构团队完成服务性能调优(计算资源利用率/SDN网络吞吐量/存储IO性能/能耗比优化)
包括英文材料
学历+
OpenStack+
IaaS+
Ansible+
Python+
Go+
相关职位

logo of digitalchina
社招

职位概述 我们正在寻找充满热情、学习能力强、对云计算和网络安全有浓厚兴趣的应届毕业生加入我们的团队。作为云/云安全运维工程师(应届生),你将从基础开始,在资深工程师的指导下,参与公司云平台(如 AWS, Azure, 阿里云, 腾讯云等)的日常运维、监控、基础架构部署以及初步的安全防护工作。这是一个快速学习和成长的平台,你将接触到业界领先的技术实践,为构建稳定、高效、安全的云环境贡献力量。 核心职责 (应届生培养方向) 1.云平台基础运维: o协助进行云资源(虚拟机、存储、网络、数据库等)的日常监控、状态检查与基础故障排查。 o学习并执行云资源的部署、配置、备份与恢复等基础操作(在指导下)。 o参与云环境成本的基础监控和优化建议。 2.云安全初步实践: o协助监控云平台安全日志和告警,识别潜在的安全风险或异常活动。 o学习和应用基础的安全组/防火墙规则、访问控制策略(IAM/RBAC)配置。 o参与漏洞扫描结果的初步分析和跟踪。 o学习并协助实施基础的安全合规性检查。 3.自动化与效率提升: o学习使用脚本语言(如 Python, Shell)或基础设施即代码工具(如 Terraform, Ansible)进行简单自动化任务的编写与执行。 o参与运维流程文档的编写和维护。 4.协作与学习: o积极向导师和团队成员学习,快速掌握云平台和云安全的核心知识与运维技能。 o参与团队的技术分享与讨论,提出改进建议。 o响应内部用户的基础技术支持请求。

更新于 2025-08-06
logo of thead
社招5年以上技术-芯片

我们正在寻找具备深厚技术功底、前瞻性视野和丰富实战经验的DevOps平台工程专家,加入我们致力于构建智能化研发基础设施的核心团队。在这里,你将主导下一代AI驱动的CI/CD平台与智能运维系统的设计与落地,推动软件研发流程向自动化、可观测性、自愈能力和数据驱动决策全面进化。 作为团队的技术骨干,你将: 1. 设计并构建高可用、智能化的CI/CD平台 主导持续集成与持续交付系统的架构演进,支持大规模分布式研发协作;探索机器学习在构建失败预测、测试用例智能推荐、资源调度优化等场景的应用,显著提升交付效率与稳定性。 2. 打造企业级智能化运维(AIOps)体系 基于Python、Go等语言,构建自动化运维工具链与平台化能力,实现基础设施即代码(IaC);引入异常检测、根因分析、故障传播图谱等AI算法,提升系统可观测性与故障响应速度,推动运维从“被动响应”向“主动预防”转变。 3. 构建全链路智能监控与自愈系统 设计并落地覆盖应用、服务、资源的端到端监控体系,集成Prometheus、Grafana、ELK、OpenTelemetry等主流技术栈;结合时序预测(LSTM、Prophet)、无监督异常检测(Isolation Forest、One-Class SVM)等模型,实现性能瓶颈预警、自动诊断与部分场景的闭环自愈。 4. 推动MLOps与DevOps深度融合 主导机器学习模型训练流水线(ML Pipeline)与模型服务化(Model Serving)平台建设,设计模型版本管理、A/B测试、流量灰度、监控告警与快速回滚机制,支撑AI能力高效、稳定地规模化落地。

更新于 2025-10-09
logo of dewu
社招3-5年技术类

1.负责公司线上及线下基础设施相关运维,提升系统稳定性和运维效率; 2.公有云/IDC资源相关需求受理及交付管理,负责各业务中短期和特殊资源需求的接收、分析、规划匹配、建设、交付跟进; 3.负责服务器、存储、基础服务等Iaas/Paas层技术评估、监控、调优、诊断及软硬件优化和故障定位分析; 4.评估硬件功能方案、基于新产品的运维场景下、完善各个过程的新产品适配可用维保障; 5.负责设备生命周期自运营维护; 6.完善运维过程的硬件/系统的技术方案输出和标准化

更新于 2023-12-26
logo of bytedance
社招3年以上A232684

1、打造业界领先的业务存储研发解决方案,管理和存储集团信息在线业务元数据; 2、负责集团信息数据服务、元数据研发工作和架构演进,包括架构设计、功能研发、技术难题攻关等; 3、围绕业务场景,分析并解决业务数据存储共性需求和痛点问题,应对架构迭代和数据合规挑战; 4、结合业界发展趋势、AI及安全合规要求,探索AI Native下的存储层理想架构。

更新于 2023-12-15