阿里云阿里云智能-可观测高级研发工程师-杭州
任职要求
1. 对技术有强烈的进取心,具有良好的沟通能力和团队合作精神、优秀的问题分析和解决能力; 2. 有三年以上工作经验,扎实的算法基础和良好的编码习惯,熟悉 Python、Go 或 Java 语言中的任意一种; 3. 对 Dify、MCP、vLLM、SGLang、A…
工作职责
1. 参与阿里云战略级产品研发,参与数据采集、处理、查询分析等功能开发与设计; 2. 负责面向 AI 原生应用的可观测数据采集,涉及数据采集探针(Python、Go、Java、eBPF 探针)的研发工作,为 AI 应用提供无侵入,高性能,低成本的数据采集能力; 3. 负责分布式调用链追踪,应用性能监控核心系统的开发,包含 AIOps 根因定位,Continuous Profiling 持续剖析等方向,帮助 AI 应用以及微服务应用实现代码级根因定位; 4. 参与 OpenTelemetry 开源社区,与国际大公司合作共建社区规范。
负责阿里集团、阿里云可观测数据处理基础设施建设,打造日增百PB级数据的实时数据分析平台。通过实时采集、索引、存储、压缩等技术,实时处理来自千万设备的海量日志数据,并针对AI应用场景进行特定优化,提供智能、自动化数据分析服务。 加入该岗位,您将有机会在国内超大规模的实时日志平台上,构建各种面向各类AI应用场景的数据存储和处理平台,打造新一代的AI基础设施。 1. 参与阿里云战略级产品SLS研发,参与面向AI应用场景的多模态数据采集、处理、检索分析等功能开发与设计; 2. 参与数据飞轮的建设,研发高质量数据集的清洗和存储、检索系统; 3. 参与Agent数据反馈回路建设,打磨Agent质量; 4. 参与建设Agent数据基座,研发稳定可靠的Agent运行时数据基础设施。
负责阿里集团、阿里云可观测数据处理基础设施建设,打造日增百PB级数据的实时数据分析平台。通过实时采集、索引、存储、压缩等技术,实时处理来自千万设备的海量日志数据,并针对AI应用场景进行特定优化,提供智能、自动化数据分析服务。 加入该岗位,您将有机会在国内超大规模的实时日志平台上,构建各种面向各类AI应用场景的数据存储和处理平台,打造新一代的AI基础设施。 1. 参与阿里云战略级产品SLS研发,参与面向AI应用场景的多模态数据采集、处理、检索分析等功能开发与设计。 2. 参与数据飞轮的建设,研发高质量数据集的清洗和存储、检索系统。 3. 参与Agent数据反馈回路建设,打磨Agent质量。 4. 参与建设Agent数据基座,研发稳定可靠的Agent运行时数据基础设施。
负责阿里集团、阿里云战略级产品SLS研发,在日增数百PB级的超大规模实时数据之上,挑战从“经典可观测性”向“AI Native 基建”的跨越。通过实时采集、索引、存储、语义检索和分析等技术,实时处理每日数百PB海量数据,并针对AI应用场景进行特定优化,提供智能、自动化数据检索和分析服务。加入该岗位,您将有机会在国内超大规模的实时日志平台上,打造新一代的AI基础设施。 1. 定义下一代 AI 数据基座: 基于现有海量日志平台,重构面向 Agent Runtime 的数据基础设施,解决高吞吐写入与低延迟语义检索共存的工程难题; 2. 构建 Data + AI 飞轮: 研发高性能的数据清洗与向量化流水线,从数据中实时化萃取高质量数据,构建AI存储和检索系统,通过构建数据反馈回路,使模型和Agent持续进化; 3. 超大规模系统攻坚: 维护并演进日处理百 PB 级数据的实时平台,在极致的成本与性能约束下,探索存算分离、混合索引等前沿技术落地。