logo of antgroup

蚂蚁金服蚂蚁集团-云原生容器平台研发专家/高级专家-杭州/北京A

社招全职3年以上技术-基础平台地点:北京 | 杭州状态:招聘

任职要求


1. 3年以上的GoPython语言经验,注重工程质量,有独立解决各种系统问题的能力;
2. 熟悉 Kubernetes/Docker 生态,掌握 Kubernetes/容器调度相关技术和相关项目代码实现;
3. 对 Linux 系统有深入的理…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


云原生容器平台是全站资源管理的基础设施平台,通过Pouch,Kubernetes等容器和平台技术,为上层业务提供标准容器服务和全局资源动态分配,调度节点单集群规模超过万台,同时致力于在系统、业务多个层面,包括os/kernel、容器/PaaS、智能调度/仿真容量等进行技术突破,提高容器系统规模化的资源利用效率,降低大促等各种大规模复杂业务场景下的资源成本,打造智能、高效、稳定的金融级基础系统。

1、基于Kubernetes打造高性能、高可用的大规模容器计算平台,通过优化/定制/开发Kubernetes平台核心组件,实现业务对平台的功能及性能需求;
2、负责平台稳定性建设,解决操作系统内核、大规模分布式系统等领域的众多技术挑战,为蚂蚁数十个大规模集群保驾护航;
3、以产品化思维完善基础设施平台的服务设计,在平台之上设计开发新的功能体验,打造面向用户应用的智能基础设施平台。
包括英文材料
Go+
Python+
Kubernetes+
还有更多 •••
相关职位

logo of aliyun
社招8年以上云智能集团

目前我们在阿里云负责云原生应用 PaaS 各个产品,包括企业级分布式应用服务(EDAS)、应用实时监控(ARMS)、API 网关(API Gateway),通过容器、微服务等技术架构,帮助企业实现 IT 架构现代化和数字化转型。 1.负责应用托管,微服务治理,网关,可观测性等产品的研发 2.分析业界技术发展趋势,了解竞争对手产品,并制定产品和技术发展路线图 3.为头部客户和种子客户提供架构咨询和技术服务保障产品成功落地 4.理解客户的需求和背后的商业价值,让产品和技术具备差异化竞争力

更新于 2026-03-26西安|成都|北京
logo of aligenie
社招8年以上

目前我们在阿里云负责云原生应用 PaaS 各个产品,包括企业级分布式应用服务(EDAS)、应用实时监控(ARMS)、API 网关(API Gateway),通过容器、微服务等技术架构,帮助企业实现 IT 架构现代化和数字化转型。 1.负责应用托管,微服务治理,网关,可观测性等产品的研发 2.分析业界技术发展趋势,了解竞争对手产品,并制定产品和技术发展路线图 3.为头部客户和种子客户提供架构咨询和技术服务保障产品成功落地 4.理解客户的需求和背后的商业价值,让产品和技术具备差异化竞争力

更新于 2026-03-26北京|杭州
logo of aliyun
社招4年以上云智能集团

1. 核心系统研发 (1)设计与优化大模型推理服务框架与分布式缓存系统。 (2)支持多推理引擎适配、多模态推理、分布式部署及高效数据管理。 (3)开发工具链与服务化能力,包括模型量化、转换、调度与生命周期管理。 2. 性能与稳定性优化 (1)优化推理服务框架的性能,包括引擎适配、生命周期管理和资源调度。 (2)深入优化kvcache的显存、内存和存储管理、批处理、缓存策略和网络传输。 (3)支持高性能通信协议、容错与负载均衡机制。 (4)提升系统可观测性,完善监控、告警与故障恢复体系。 3. 引擎与应用集成 (1)深度集成推理引擎、缓存系统和存储系统,优化访问模式与架构设计。 (2)满足大规模、多模态推理场景下的高吞吐与低延迟需求。

更新于 2026-01-07北京|杭州
logo of aligenie
社招4年以上

1. 核心系统研发 (1)设计与优化大模型推理服务框架与分布式缓存系统。 (2)支持多推理引擎适配、多模态推理、分布式部署及高效数据管理。 (3)开发工具链与服务化能力,包括模型量化、转换、调度与生命周期管理。 2. 性能与稳定性优化 (1)优化推理服务框架的性能,包括引擎适配、生命周期管理和资源调度。 (2)深入优化kvcache的显存、内存和存储管理、批处理、缓存策略和网络传输。 (3)支持高性能通信协议、容错与负载均衡机制。 (4)提升系统可观测性,完善监控、告警与故障恢复体系。 3. 引擎与应用集成 (1)深度集成推理引擎、缓存系统和存储系统,优化访问模式与架构设计。 (2)满足大规模、多模态推理场景下的高吞吐与低延迟需求。

更新于 2026-04-03北京|杭州