logo of aliyun

阿里云阿里云智能-容器运行时研发专家-杭州/北京

社招全职5年以上云智能集团地点:北京 | 杭州状态:招聘

任职要求


计算机、软件工程及相关专业,计算机基础知识与编程基本功扎实,熟悉Go/Python/C++至少一种。
熟悉至少一项云原生技术(如Docker/Containerd/runC/KataContainer/gVisor, Kubernetes等),有相关开源项目贡献或者大规…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责阿里云容器服务在阿里云基础底座的基础设施与应用架构方向的产品研发与技术演进。
主导建设容器构建环境,容器运行环境的安全稳定的运行时技术,实现机密计算场景下的数据分发,运行隔离的安全能力。
主导容器运行时技术在支持云底座的大规模场景下的运行时能力,提升资源利用效率、系统稳定性与运行性能。
包括英文材料
Go+
Python+
C+++
还有更多 •••
相关职位

logo of antgroup
社招技术-开发

Kata Containers 是由蚂蚁金服和Intel共同领导的基于虚拟化技术的开源安全容器运行时引擎,是OpenStack基金会的顶级开放基础设施项目。蚂蚁超级计算容器运行时团队同时支持上游社区的kata containers,机密计算CoCo,containerd, k8s 等开源社区的开发,以及面向蚂蚁集团内部场景的kata安全容器,containerd,机密计算,构筑金融级云原生平台的稳定,安全,高性能的运行时平台。本岗位需要参与上游开发和内部应用支持,并探索利用创新软硬件技术提升容器和存储应用的安全性和效率,并在性能观测,机密计算,算力优化等方面有所建树。

更新于 2025-04-15北京|杭州
logo of aliyun
社招5年以上云智能集团

我们正在构建面向 GPU 超级节点架构的新一代智算多租容器计算系统,采用以 Rust 编写的轻量级 VMM 为核心的安全容器架构,致力于打造具备强隔离、低虚拟化开销、高兼容性的 AI 原生运行时环境。你将作为核心系统工程师,深度参与底层虚拟化关键技术攻关,解决安全容器在大规模 GPU 计算场景下的性能、隔离与可扩展性难题。 这不仅是一次系统级编程的挑战,更是参与定义 AI 时代安全容器基础设施标准的战略机遇。 主要职责: 1)负责 GPU 超级节点新硬件的技术评估与选型标准制定,输出硬件适配路线图。 2)主导安全容器环境中设备虚拟化的关键技术攻坚,涵盖 vSMMU、SVA、GPUDirect RDMA 等核心模块的研发与优化。 3)设计并建设面向 GPU 超级节点的底层 VMM 自动化评测体系,支持性能、稳定性、安全性等多维度量化评估。 4)支撑系统在超大规模 AI 集群中的生产级落地,确保系统具备高可用、高性能、低成本的工程优势。 5)输出高质量系统设计文档,参与智算多租容器计算系统的底层架构评审与技术决策,推动架构持续演进。

更新于 2026-01-05北京|杭州
logo of aliyun
社招5年以上云智能集团

1、设计并实现高安全、低延迟的AI Agent沙箱运行时,支持Python、Node.js、Bash等语言执行。 2、构建沙箱生命周期管理系统:支持create、stop、resume、close,实现状态持久化与资源复用。 3、优化沙箱冷启动性能,设计预热池、镜像分层加载、快照恢复等机制。 4、制定安全策略,防范命令注入、路径遍历、资源耗尽等攻击,支持多租户隔离。 5、实现沙箱的可观测性体系:日志、监控、trace、调试入口。 6、编写高质量代码、技术文档,参与代码评审与系统架构演进。

更新于 2025-09-05北京|杭州
logo of aliyun
社招5年以上技术类-开发

1. 参与kuberGPU软件产品的设计与研发,包括kuberGPU软件的迭代研发,性能评估及优化,兼容性提升,新GPU的适配等。 2. 负责kuberGPU在云上的落地,包括与相关团队沟通和协调对接和部署工作,以及针对专属云做对应的kuberGPU软件的适配工作。 3. 保障kuberGPU产品在云上的的稳定性,包括定位和分析上线后遇到的问题,及时进行故障排查和修复。 4. 针对客户的需求和未来业内技术趋势,为业务方提供新的技术支持和建议,并作出高可用、高可靠、高拓展性的技术架构规划和落地。

更新于 2025-06-18北京|杭州|上海