阿里云阿里云智能-虚拟化系统运维专家-杭州/上海
社招全职5年以上云智能集团地点:杭州 | 上海状态:招聘
任职要求
1.计算机或相关专业,5年以上虚拟化平台运维或开发经验,熟悉Linux内核机制。 2.精通KVM/QEMU架构,熟悉Libvirt、VFIO、vhost、SR-IOV等关键技术,具备实际调优经验。 3.熟练掌握Shell/Python等脚本语言,具备自动化运维工具开发能力。 4.具备大规模云平台(如OpenStack、ZStack、自研云)部署与运维经验,熟悉CI/CD流程,有自动化测试或质量保障体系建设经验优先。 5.具备良好的沟通能力和团队协作精神,能适应高强度项目节奏,有国外云项目经验者优先。
工作职责
1.负责虚拟化Hypervisor运维平台的架构设计、技术选型与核心功能开发。 2.主导虚拟化资源池的部署、优化与持续运维,保障高可用、高性能及可扩展性。 3.参与云平台与虚拟化层的深度集成,推动自动化部署、热迁移、热升级、变更等核心功能落地。 4.负责虚拟化相关问题的根因分析与性能调优,解决大规模实例运行中的稳定性与性能瓶颈。 5.设计并实施虚拟化相关质量保障体系,包括自动化测试框架、回归测试流程和故障注入演练。 6.协同管控、网络、存储、安全等团队完成虚拟化Hypervisor层的安全加固、合规改造与运维/质量标准化建设。
包括英文材料
Linux+
https://ryanstutorials.net/linuxtutorial/
Ok, so you want to learn how to use the Bash command line interface (terminal) on Unix/Linux.
https://ubuntu.com/tutorials/command-line-for-beginners
The Linux command line is a text interface to your computer.
https://www.youtube.com/watch?v=6WatcfENsOU
In this Linux crash course, you will learn the fundamental skills and tools you need to become a proficient Linux system administrator.
https://www.youtube.com/watch?v=v392lEyM29A
Never fear the command line again, make it fear you.
https://www.youtube.com/watch?v=ZtqBQ68cfJc
内核+
https://www.youtube.com/watch?v=C43VxGZ_ugU
I rummage around the Linux kernel source and try to understand what makes computers do what they do.
https://www.youtube.com/watch?v=HNIg3TXfdX8&list=PLrGN1Qi7t67V-9uXzj4VSQCffntfvn42v
Learn how to develop your very own kernel from scratch in this programming series!
https://www.youtube.com/watch?v=JDfo2Lc7iLU
Denshi goes over a simple explanation of what computer kernels are and how they work, alonside what makes the Linux kernel any special.
Bash+
[英文] The Bash Guide
https://guide.bash.academy/
A quality-driven guide through the shell's many features.
https://www.youtube.com/watch?v=tK9Oc6AEnR4
Understanding how to use bash scripting will enhance your productivity by automating tasks, streamlining processes, and making your workflow more efficient.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
脚本+
[英文] Scripting language
https://en.wikipedia.org/wiki/Scripting_language
https://zhuanlan.zhihu.com/p/571097954
一个脚本通常是解释执行而非编译。脚本语言通常都有简单、易学、易用的特性,目的就是希望能让程序员快速完成程序的编写工作。
OpenStack+
https://www.youtube.com/watch?v=_gWfFEuert8
Learn how to use OpenStack and manage your own private cloud.
CI+
https://www.ibm.com/cn-zh/think/topics/continuous-integration
持续集成 (CI) 是一种软件开发实践,开发人员在整个开发周期中会定期将新的代码和代码变更集成到中央代码存储库中。它是 DevOps 和敏捷方法的关键组成部分。
https://www.youtube.com/watch?v=42UP1fxi2SY
CD+
https://www.redhat.com/zh-cn/topics/devops/what-is-ci-cd
CI/CD 是持续集成和持续交付/部署的缩写,旨在简化并加快软件开发生命周期。
https://www.youtube.com/watch?v=R8_veQiYBjI&list=PLy7NrYWoggjzSIlwxeBbcgfAdYoxCIrM2
相关职位
社招5年以上云智能集团
1. 在Intel/AMD/ARM等新硬件平台进行Hypervisor关键特性的研发,使能硬件加速能力,降低虚拟化性能开销。 2. 通过技术创新和软硬结合,构建Hypervisor在计算路径/IO路径上的数据校验能力,保障Hypervisor数据安全。 3. 提升虚拟机的运维能力,持续对热迁移/热升级/热插拔/快照技术进行打磨优化,保障线上系统稳定性。
更新于 2025-09-03
社招5年以上云智能集团
1. 负责GPU服务器依赖的虚拟化组件的开发迭代,来满足业务对稳定性、安全、性能、运维等方面的要求 2. 负责研究轻量虚拟化/安全容器等云原生场景下系统底层技术在GPU业务场景的应用 3. 负责GPU驱动在业务场景的功能开发、维护并和GPU厂商对接相关技术需求 4. 负责异构虚拟化领域前沿技术的探索,并推动有业务价值的技术落地
更新于 2025-08-18
社招5年以上技术类-开发
1. 依据公共云统一架构、OpenAPI规范、软件技术栈以及交付运维体系,负责专属云产品的研发与交付。深度参与灵骏裸金属服务器及EGS云计算服务器的研发流程,包括硬件架构预研、方案设计、软硬件结合的系统优化、线上服务质量保证以及提供专家技术支持等关键环节,确保产品从研发到运维的全生命周期高效管理。 2. 跟踪并把握GPU架构设计的发展趋势,探索前沿的GPU架构设计技术。联合高性能网络团队共同设计网络互联架构,针对分布式训练和推理业务场景,在软硬件协同及高性能网络方向上寻找性能优化的新途径,构建阿里云加速计算云服务器的核心竞争力。 3. 研发并持续改进系统的稳定性和安全性,确保平台的安全可靠运行,并不断提升对外服务质量标准。
更新于 2025-06-18