阿里云阿里云智能-神龙虚拟化研发技术专家-杭州/上海
任职要求
1. 5年以上虚拟化或Linux内核相关工作经验,具备扎实的计算机系统基础理论知识,熟悉X86或ARM体系结构。 2. 熟悉系统虚拟化中CPU虚拟化/内存虚拟化/中断虚拟化/IO虚拟化等核心模块工作原理,有XEN/KVM/QEMU等开源虚拟化项目开发经验者优先。 3. 熟悉Linux内核调度器/内存管理/cgroups隔离/RAS 等模块工作原理,有丰富的内核态开发和debug经验。 4. 喜欢挑战性的工作,有韧性;有较强的自我驱动能力;具备较强的学习能力以及动手实践能力。
工作职责
1. 在Intel/AMD/ARM等新硬件平台进行Hypervisor关键特性的研发,使能硬件加速能力,降低虚拟化性能开销。 2. 通过技术创新和软硬结合,构建Hypervisor在计算路径/IO路径上的数据校验能力,保障Hypervisor数据安全。 3. 提升虚拟机的运维能力,持续对热迁移/热升级/热插拔/快照技术进行打磨优化,保障线上系统稳定性。
1. 技术方案设计 ● 了解并分析ECS基础设施(如神龙MoC卡 + 宿主机)在系统稳定性与高可用方面的设计目标; ● 根据业务需求,评估技术可行性,参与方案评审,完成技术选型、功能设计、系统架构、数据结构和开发流程的规划。 2. 技术实现 ● 参与虚拟机故障逃生等创新性技术的研发工作,能根据整体方案拆解任务,独立完成模块设计、编码和系统功能开发; ● 负责故障检测、隔离、恢复、数据一致性校验等核心功能的架构设计和代码实现,持续优化系统性能; ● 参与代码评审和阶段性讨论,通过调试和优化,确保代码高质量交付; ● 负责开发和上线后的系统维护,包括值班响应、问题排查、故障诊断、体验优化、性能与成本调优等; ● 编写必要的技术文档,如操作手册、排障指南、API说明等,支持团队运维和问题处理。 3. 系统稳定性与性能优化 ● 运用优化方法和技术手段,提升系统的安全性、稳定性和运行效率,保障ECS基础设施的可靠运行,改善客户使用体验。 4. 技术预研 ● 跟踪系统可靠性(RAS)和高可用技术的发展趋势,结合实际业务需求,提出可行的技术建议和架构改进方案。 5. 技术规划 ● 深入理解业务方向,结合长期发展需求,制定高可用、高可靠、易扩展的技术架构规划,并推动落地实施。
1、技术方案设计,技术方案的落地与实现,并确保产品稳定性并持续提升产品性能实现性能优化, 2、参与从用户侧到后端资源侧,数据链路,控制链路,性能日志采集,审计,检索,分析等一整套分布式系统的研发,提供全球数据库服务; 3、利用云原生,基于K8S,Docker,云上ECS/神龙,云盘,VPC等云原生技术与数据库技术结合,给用户提供优质体验,高性价比,易用,高性能的云数据库服务; 4、通过产品化,智能化方式管控阿里云和阿里巴巴经济体的大规模分布式数据库实例集群,并支撑公共云和集团业务需求,为双十一等大促场景提供稳定,顺滑的体验。 5、参与数据库 DBaaS 平台的产品规划和平台技术演进。