蚂蚁金服蚂蚁集团-云原生容器平台研发专家/高级专家-杭州/北京A
任职要求
1. 3年以上的Go或Python语言经验,注重工程质量,有独立解决各种系统问题的能力; 2. 熟悉 Kubernetes/Docker 生态,掌握 Kubernetes/容器调度相关技术和相关项目代码实现; 3. 对 Linux 系统有深入的理…
工作职责
云原生容器平台是全站资源管理的基础设施平台,通过Pouch,Kubernetes等容器和平台技术,为上层业务提供标准容器服务和全局资源动态分配,调度节点单集群规模超过万台,同时致力于在系统、业务多个层面,包括os/kernel、容器/PaaS、智能调度/仿真容量等进行技术突破,提高容器系统规模化的资源利用效率,降低大促等各种大规模复杂业务场景下的资源成本,打造智能、高效、稳定的金融级基础系统。 1、基于Kubernetes打造高性能、高可用的大规模容器计算平台,通过优化/定制/开发Kubernetes平台核心组件,实现业务对平台的功能及性能需求; 2、负责平台稳定性建设,解决操作系统内核、大规模分布式系统等领域的众多技术挑战,为蚂蚁数十个大规模集群保驾护航; 3、以产品化思维完善基础设施平台的服务设计,在平台之上设计开发新的功能体验,打造面向用户应用的智能基础设施平台。
目前我们在阿里云负责云原生应用 PaaS 各个产品,包括企业级分布式应用服务(EDAS)、应用实时监控(ARMS)、API 网关(API Gateway),通过容器、微服务等技术架构,帮助企业实现 IT 架构现代化和数字化转型。 1.负责应用托管,微服务治理,网关,可观测性等产品的研发 2.分析业界技术发展趋势,了解竞争对手产品,并制定产品和技术发展路线图 3.为头部客户和种子客户提供架构咨询和技术服务保障产品成功落地 4.理解客户的需求和背后的商业价值,让产品和技术具备差异化竞争力

目前我们在阿里云负责云原生应用 PaaS 各个产品,包括企业级分布式应用服务(EDAS)、应用实时监控(ARMS)、API 网关(API Gateway),通过容器、微服务等技术架构,帮助企业实现 IT 架构现代化和数字化转型。 1.负责应用托管,微服务治理,网关,可观测性等产品的研发 2.分析业界技术发展趋势,了解竞争对手产品,并制定产品和技术发展路线图 3.为头部客户和种子客户提供架构咨询和技术服务保障产品成功落地 4.理解客户的需求和背后的商业价值,让产品和技术具备差异化竞争力
1. 核心系统研发 (1)设计与优化大模型推理服务框架与分布式缓存系统。 (2)支持多推理引擎适配、多模态推理、分布式部署及高效数据管理。 (3)开发工具链与服务化能力,包括模型量化、转换、调度与生命周期管理。 2. 性能与稳定性优化 (1)优化推理服务框架的性能,包括引擎适配、生命周期管理和资源调度。 (2)深入优化kvcache的显存、内存和存储管理、批处理、缓存策略和网络传输。 (3)支持高性能通信协议、容错与负载均衡机制。 (4)提升系统可观测性,完善监控、告警与故障恢复体系。 3. 引擎与应用集成 (1)深度集成推理引擎、缓存系统和存储系统,优化访问模式与架构设计。 (2)满足大规模、多模态推理场景下的高吞吐与低延迟需求。

1. 核心系统研发 (1)设计与优化大模型推理服务框架与分布式缓存系统。 (2)支持多推理引擎适配、多模态推理、分布式部署及高效数据管理。 (3)开发工具链与服务化能力,包括模型量化、转换、调度与生命周期管理。 2. 性能与稳定性优化 (1)优化推理服务框架的性能,包括引擎适配、生命周期管理和资源调度。 (2)深入优化kvcache的显存、内存和存储管理、批处理、缓存策略和网络传输。 (3)支持高性能通信协议、容错与负载均衡机制。 (4)提升系统可观测性,完善监控、告警与故障恢复体系。 3. 引擎与应用集成 (1)深度集成推理引擎、缓存系统和存储系统,优化访问模式与架构设计。 (2)满足大规模、多模态推理场景下的高吞吐与低延迟需求。