阿里云阿里云智能-智算全栈系统优化专家-杭州

社招全职5年以上云智能集团2025-12-07地点：杭州状态：招聘

扫码手机上打开

任职要求

1、5年以上系统性能相关经验，有AI领域性能调优经验者优先。
2、深入掌握Kubernetes、containerd、CRI-O等容器生态技术，了解安全容器的技术思路及相关实现；熟悉Linux内核（如Cgroups、Namespace、eBPF）及系统级资源隔离技术；熟练使用性能分析工具（如perf、bcc、Prometheus、Jaeger、火焰图）定位云原生系统的性能瓶颈。
3、精通PyTor…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

该岗位将承担智算底层系统性能优化、全栈协同性能优化两个方向的职责。
1、主导AI领域下阿里云云原生多租底层系统的性能瓶颈分析及优化设计，提升底层系统弹性、性能及成本竞争力。
2、优化AI应用场景安全容器运行时、虚拟化、linux内核等核心组件性能。
3、设计高并发、低延迟的云原生底层系统架构，支持AI场景节点pod极速弹缩及系统稳定性。
4、在云原生底层（操作系统内核、容器运行时、CRI-O等）和AI工作负载间建立性能优化协同框架，支撑大模型训练、分布式推理等AI应用在安全容器运行环境中保持性能竞争力。
5、优化AI模型在安全容器环境下的部署、分发、加载效率，支持AI应用极速启动。
6、设计并开发定制化监控和诊断工具链，实时分析云原生AI场景的GPU、CPU、内存、网络、存储性能瓶颈及热路径。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

性能调优+

Kubernetes+

CRI-O+

Linux+

内核+

eBPF+

Perf+

Jaeger+

还有更多 •••

登录查看完整学习资料

相关职位

阿里云智能-资深技术专家（专有云智算方向）-北京/杭州/上海/深圳/成都

社招5年以上技术类-开发

阿里云专有云是面向政企行业客户的全栈云平台，为企业级客户（政府、金融、部委、央企等行业）提供产品和服务。该岗位主要负责专有云智算平台架构规划、系统设计及核心技术研发。核心职责包括： 1、主导智算平台的全栈架构设计。针对不同平台芯片/不同集群规模做整体方案设计，满足千卡/万卡集群高并发、低延迟、弹性可扩展等需求。 2、性能及稳定性优化，提升集群运行效率，不断提升技术竞争力。 3、跟踪前沿技术趋势，推动新技术落地应用。参与行业标准制定。

更新于 2025-05-22成都|北京|深圳

阿里云智能-智算全栈系统优化专家-杭州

社招5年以上云智能集团

该岗位将承担智算底层系统性能优化、全栈协同性能优化两个方向的职责。 1、主导AI领域下阿里云云原生多租底层系统的性能瓶颈分析及优化设计，提升底层系统弹性、性能及成本竞争力。 2、优化AI应用场景安全容器运行时、虚拟化、linux内核等核心组件性能。 3、设计高并发、低延迟的云原生底层系统架构，支持AI场景节点pod极速弹缩及系统稳定性。 4、在云原生底层（操作系统内核、容器运行时、CRI-O等）和AI工作负载间建立性能优化协同框架，支撑大模型训练、分布式推理等AI应用在安全容器运行环境中保持性能竞争力。 5、优化AI模型在安全容器环境下的部署、分发、加载效率，支持AI应用极速启动。 6、设计并开发定制化监控和诊断工具链，实时分析云原生AI场景的GPU、CPU、内存、网络、存储性能瓶颈及热路径。

更新于 2025-09-08杭州

阿里云智能-智算集群通信优化技术专家-北京杭州

社招5年以上云智能集团

1、技术方案设计 • 调研AI大模型训练及推理的前沿技术发展，分析前沿技术和网络的关联以及优化方向； • 分析客户需求，帮助客户使用我们的产品和解决方案，帮忙客户进行性能优化； 2、技术实现 • 负责AI计算系统的通信库研发、测试、以及交付与支持 • 基于技术方案的拆解，按照任务目标和产出规范，完成任务/子任务的设计、编码开发和系统功能实现 • 负责核心功能的架构与代码模板的编写，开发与维护系统公用核心模块，技术架构重构、优化等 • 对编码进行阶段性的讨论和CodeReview，并通过调试优化，推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代，包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等 3、稳定性和性能优化 • 制定稳定性策略，寻找并解决产品系统中的潜在风险和瓶颈，覆盖线上疑难杂症问题，确保系统的安全可靠 • 运用产品优化技术和方法，进行性能优化，提高产品稳定性和性能 4、技术预研 • 分析AI业务通信pattern和发展趋势，探索通信库的优化空间，以及AI计算系统全栈的协同设计，提升系统端到端的稳定性和性能 5、技术规划 • 理解业务战略及重点，基于业务需求作出高性能、高可用、高可靠、高拓展性的技术架构规划和落地。

更新于 2026-03-25北京|杭州

蚂蚁集团-高级网络研发工程师/网络专家-杭州A

社招3年以上技术类-开发

我们是蚂蚁网络基础设施团队，为蚂蚁提供稳定高效的网络连接服务。我们致力于研发和建设一流的网络基础设施，通过技术驱动来不断优化通算和智算业务连接成本、性能和稳定性。 ● 负责蚂蚁AIDC网络架构设计、演进以及交换机或网卡协议栈等研发优化落地 ● 通过算法-框架-工程协同实现成本和性能全局最优

更新于 2025-04-03杭州