logo of aliyun

阿里云阿里云智能-虚拟化开发专家-北京/上海/杭州

社招全职5年以上云智能集团地点:北京 | 杭州 | 上海状态:招聘

任职要求


1. 熟悉软硬件协同设计与开发,有 AI Infrastructure、智能网卡、加速卡、卸载卡、DPDK、SPDK 开发经验者优先;
2. 熟悉 x86 或 ARM体系结构,系统虚拟化中的 CPU 虚拟化(VT-x)、内存虚拟化(EPT、Shared Virtual Memory)、中断虚拟化(Interrupt Remapping、MSI/MSI-X、Posted Interrupt)、I/O 虚拟化(IOMMU/SMMU、VFIO、SR-IOV、Scalable IOV)和 GPU 虚拟化等核心模块的工作原理;
3. 有系统级的 RAS 开发与设计经验,熟悉 CPU、内存、PCI…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 技术方案设计
● 了解并分析ECS基础设施(如神龙MoC卡 + 宿主机)在系统稳定性与高可用方面的设计目标;
● 根据业务需求,评估技术可行性,参与方案评审,完成技术选型、功能设计、系统架构、数据结构和开发流程的规划。
2. 技术实现
● 参与虚拟机故障逃生等创新性技术的研发工作,能根据整体方案拆解任务,独立完成模块设计、编码和系统功能开发;
● 负责故障检测、隔离、恢复、数据一致性校验等核心功能的架构设计和代码实现,持续优化系统性能;
● 参与代码评审和阶段性讨论,通过调试和优化,确保代码高质量交付;
● 负责开发和上线后的系统维护,包括值班响应、问题排查、故障诊断、体验优化、性能与成本调优等;
● 编写必要的技术文档,如操作手册、排障指南、API说明等,支持团队运维和问题处理。
3. 系统稳定性与性能优化
● 运用优化方法和技术手段,提升系统的安全性、稳定性和运行效率,保障ECS基础设施的可靠运行,改善客户使用体验。
4. 技术预研
● 跟踪系统可靠性(RAS)和高可用技术的发展趋势,结合实际业务需求,提出可行的技术建议和架构改进方案。
5. 技术规划
● 深入理解业务方向,结合长期发展需求,制定高可用、高可靠、易扩展的技术架构规划,并推动落地实施。
包括英文材料
Linux+
内核+
Docker+
Rust+
C+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能集团

1. 负责新一代AI驱动的PC产品质量保证工作与团队建设,主导质量团队的组织架构设计、人才梯队培养及绩效管理,打造一支具备系统底层、应用上层及 AI 评测能力的复合型质量团队,对最终产品交付质量与用户体验负责; 2. 构建覆盖“安卓系统-上层应用-AI Agent"的全链路质量保证体系。主导跨域质量架构设计,解决终端稳定性兼容性、云边端协同、分布式系统一致性、AI非确定性输出等复杂质量挑战,制定统一的质量门禁与发布准出标准,确保端到端交付质量; 3. 引领测试技术的智能化转型,探索"AI for Testing"与"Testing for AI"双轮驱动模式。一方面将 AI 能力融入自动化测试、用例生成、缺陷分析等环节提升效能;另一方面建立针对 AI Agent/LLM 产品的专项评估体系(如准确性、安全性、幻觉检测),解决非确定性输出的质量挑战,保持行业技术领先性; 4. 主导测试能力平台化与服务化建设,构建系统级、应用级、服务端及 AI 评估的自动化用例库。推动质量能力与 CI/CD 流水线深度集成,实现代码变更的自动化质量卡点。打造自助式质量验证平台,赋能研发、运维及合作伙伴,降低质量验证门槛,提升整体交付效率; 5. 建立多维度的质量度量体系,结合线上监控、灰度发布数据及用户反馈,驱动质量问题的根因分析与持续改进闭环,对线上重大质量事故负责,建立快速响应与防御机制,保障业务连续性。

更新于 2026-03-27北京|深圳|杭州
logo of aligenie
社招5年以上

1. 负责新一代AI驱动的PC产品质量保证工作与团队建设,主导质量团队的组织架构设计、人才梯队培养及绩效管理,打造一支具备系统底层、应用上层及 AI 评测能力的复合型质量团队,对最终产品交付质量与用户体验负责; 2. 构建覆盖“安卓系统-上层应用-AI Agent"的全链路质量保证体系。主导跨域质量架构设计,解决终端稳定性兼容性、云边端协同、分布式系统一致性、AI非确定性输出等复杂质量挑战,制定统一的质量门禁与发布准出标准,确保端到端交付质量; 3. 引领测试技术的智能化转型,探索"AI for Testing"与"Testing for AI"双轮驱动模式。一方面将 AI 能力融入自动化测试、用例生成、缺陷分析等环节提升效能;另一方面建立针对 AI Agent/LLM 产品的专项评估体系(如准确性、安全性、幻觉检测),解决非确定性输出的质量挑战,保持行业技术领先性; 4. 主导测试能力平台化与服务化建设,构建系统级、应用级、服务端及 AI 评估的自动化用例库。推动质量能力与 CI/CD 流水线深度集成,实现代码变更的自动化质量卡点。打造自助式质量验证平台,赋能研发、运维及合作伙伴,降低质量验证门槛,提升整体交付效率; 5. 建立多维度的质量度量体系,结合线上监控、灰度发布数据及用户反馈,驱动质量问题的根因分析与持续改进闭环,对线上重大质量事故负责,建立快速响应与防御机制,保障业务连续性。

更新于 2026-04-01北京|深圳|杭州
logo of aliyun
社招5年以上云智能集团

1. 设计,开发和调优混合云存储产品的数据平面,包括但不限于Guest OS/Hypervisor/存储网关/阿里云等层面上的存储,备份,数据服务,容灾恢复等核心功能的数据平面能力; 2. 推动技术与业务的发展,在专有云与公有云中设计和开发不同形态的混合云服务; 3. 产品负责人岗位需跟踪协调合作伙伴产品(例如网关)功能和进度制定阿里云相应的功能适配;制定自主研发混合云存储产品的数据平面技术架构选择、开源和自研模块集成策略。

更新于 2025-07-31北京|上海|杭州
logo of aliyun
社招5年以上云智能集团

1、系统安全特性研发:主导或参与机密计算(Confidential Computing)、远程证明(Remote Attstation)、云原生机密容器、虚拟化安全等关键技术的研发与产品化落地; 2、构建端到端可信软件供应链:设计并实现支持 SLSA Provenance、SBOM、可重复 / 可验证构建的工具链与平台能力; 3、全栈安全方案设计:结合硬件、内核、用户态组件,打造纵深防御的安全架构; 4、推动前沿安全技术转化:跟踪系统安全、可信执行环境(TEE)、AI 安全等方向趋势,将研究成果转化为可规模化落地的工程方案; 5、参与开源与标准建设:积极参与并贡献系统安全相关开源社区,持续输出具有影响力的技术成果。

更新于 2025-12-10北京|杭州|上海