logo of aliyun

阿里云阿里云智能-AI Infra 高级研发工程师-杭州

社招全职3年以上云智能集团地点:杭州 | 上海状态:招聘

任职要求


1. 熟悉AI领域,对于AI应用数据特征、数据存储和查询需求有深入理解,对Agent有实践经验;
2. 理解 LLM 推理服务的流量特征。熟悉 gRPCWebSocket、SSE (Server-Sent Events) 等流式协议在 AI Agent 场景下的应用;
3. 理解云原生网关架构,熟悉 Envoy/Nginx/Istio 等开源网关或 Service Mesh 的底层原理及扩展开发(如 Lua/WASM 插件);
4. 具备复杂场景下的流量治理经验、分布式限流、熔断降级及灰度发…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责阿里集团、阿里云可观测数据处理基础设施建设,打造日增百PB级数据的实时数据分析平台。通过实时采集、索引、存储、压缩等技术,实时处理来自千万设备的海量日志数据,并针对AI应用场景进行特定优化,提供智能、自动化数据分析服务。

加入该岗位,您将有机会在国内超大规模的实时日志平台上,构建各种面向各类AI应用场景的数据存储和处理平台,打造新一代的AI基础设施。
1. 参与阿里云战略级产品SLS研发,参与面向AI应用场景的多模态数据采集、处理、检索分析等功能开发与设计;
2. 参与数据飞轮的建设,研发高质量数据集的清洗和存储、检索系统;
3. 参与Agent数据反馈回路建设,打磨Agent质量;
4. 参与建设Agent数据基座,研发稳定可靠的Agent运行时数据基础设施。
包括英文材料
AI agent+
大模型+
gRPC+
WebSocket+
Envoy+
还有更多 •••
相关职位

logo of aliyun
社招3年以上云智能集团

负责阿里集团、阿里云战略级产品SLS研发,在日增数百PB级的超大规模实时数据之上,挑战从“经典可观测性”向“AI Native 基建”的跨越。通过实时采集、索引、存储、语义检索和分析等技术,实时处理每日数百PB海量数据,并针对AI应用场景进行特定优化,提供智能、自动化数据检索和分析服务。加入该岗位,您将有机会在国内超大规模的实时日志平台上,打造新一代的AI基础设施。 1. 定义下一代 AI 数据基座: 基于现有海量日志平台,重构面向 Agent Runtime 的数据基础设施,解决高吞吐写入与低延迟语义检索共存的工程难题; 2. 构建 Data + AI 飞轮: 研发高性能的数据清洗与向量化流水线,从数据中实时化萃取高质量数据,构建AI存储和检索系统,通过构建数据反馈回路,使模型和Agent持续进化; 3. 超大规模系统攻坚: 维护并演进日处理百 PB 级数据的实时平台,在极致的成本与性能约束下,探索存算分离、混合索引等前沿技术落地。

更新于 2026-01-09杭州
logo of aliyun
社招3年以上云智能集团

负责阿里集团、阿里云可观测数据处理基础设施建设,打造日增百PB级数据的实时数据分析平台。通过实时采集、索引、存储、压缩等技术,实时处理来自千万设备的海量日志数据,并针对AI应用场景进行特定优化,提供智能、自动化数据分析服务。 加入该岗位,您将有机会在国内超大规模的实时日志平台上,构建各种面向各类AI应用场景的数据存储和处理平台,打造新一代的AI基础设施。 1. 参与阿里云战略级产品SLS研发,参与面向AI应用场景的多模态数据采集、处理、检索分析等功能开发与设计。 2. 参与数据飞轮的建设,研发高质量数据集的清洗和存储、检索系统。 3. 参与Agent数据反馈回路建设,打磨Agent质量。 4. 参与建设Agent数据基座,研发稳定可靠的Agent运行时数据基础设施。

更新于 2026-02-11杭州|上海
logo of aliyun
社招3-5年云智能集团

弹性计算异构AI推理团队,承担着构建阿里云IAAS资源在公共云竞争力的职责。在AI领域,团队对接业界主要AI用户的业务需求,承接提升GPU、AI加速器等芯片在AI场景的竞争力职责。和团队一起通过专家领域知识和软硬件分析能力构建阿里云在AI场景的核心竞争力和加速解决方案。 1. 负责基于云上AI真实场景的解决方案和性能分析系统建设,构建性能标尺。 2. 负责基于云上大规模推理场景的构建和底层软件性能优化工作。 3. 负责包括CIPU、GPU、AI加速器等硬件在阿里云AI场景的竞争力构建。 4. 与厂商和内部业务团队合作,为阿里云的AI用户提供具有竞争力的AI解决方案。

更新于 2025-07-15北京|杭州|上海
logo of aliyun
社招5年以上云智能集团

1. 基于对目前主流AI芯片的深刻理解,分析硬件系统结构,提供软硬件优化实践和调优指南; 2. 了解市场上主流AI,大数据,HPC应用对异构计算系统设计的挑战,应用AI加速芯片,设计打造高效异构计算产品; 3. 聚焦异构资源在线性能分析,负责系统级性能分析和业务瓶颈定位,助力异构集群的极致稳定; 4. 实现异构计算基础设施serverless化,驱动异构云原生架构演进; 5. 洞悉人工智能及深度学习的应用发展趋势,参与下一代机器学习算力产品设计。

更新于 2025-09-24杭州