logo of aliyun

阿里云阿里云智能-可观测高级研发工程师-杭州

社招全职3年以上云智能集团地点:杭州状态:招聘

任职要求


1. 对技术有强烈的进取心,具有良好的沟通能力和团队合作精神、优秀的问题分析和解决能力;
2. 有三年以上工作经验,扎实的算法基础和良好的编码习惯,熟悉 PythonGoJava 语言中的任意一种;
3. 对 Dify、MCP、vLLM、SGLang、A…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 参与阿里云战略级产品研发,参与数据采集、处理、查询分析等功能开发与设计;
2. 负责面向 AI 原生应用的可观测数据采集,涉及数据采集探针(Python、Go、Java、eBPF 探针)的研发工作,为 AI 应用提供无侵入,高性能,低成本的数据采集能力;
3. 负责分布式调用链追踪,应用性能监控核心系统的开发,包含 AIOps 根因定位,Continuous Profiling 持续剖析等方向,帮助 AI 应用以及微服务应用实现代码级根因定位;
4. 参与 OpenTelemetry 开源社区,与国际大公司合作共建社区规范。
包括英文材料
算法+
编程规范+
Python+
Go+
Java+
MCP+
还有更多 •••
相关职位

logo of xiaohongshu
社招3年以上机器学习平台

1、负责模型训练平台核心功能开发和架构设计,包括传统CN/NLP/SD/LLM等多场景支持 2、负责大模型后训练工具平台化建设,包括后预训练、微调、对齐等技术落地 3、设计和实现高性能分布式训练系统,打造端到端训练解决方案 4、优化训练调度和资源管理,提升集群利用率和训练效率 5、开发模型训练监控诊断工具,建设可观测性体系

北京|上海|深圳
logo of aliyun
社招5年以上技术类-前端

1、负责小天基/神农控制台/ASO/staragent/统一运维平台的前端开发工作,完成产品的前端框架升级,保证流畅的交互体验。 2、结合阿里云整体的视觉设计风格,建设统一的前端基础组件库(组件库、图形库、工程体系、低代码、服务化平台等),保障前端性能及交互一致性的同时,提升研发效率 3、基于阿里云统一的AEM基础设施对用户行为进行记录并建立数据化度量体系,为产品交互及后端性能优化方案或技术选型提供数据支撑 4、负责线上系统的维护和管理,保障系统稳定运行;

更新于 2025-04-02杭州
logo of aliyun
社招3年以上技术类-开发

1、技术方案设计 • 收集、识别、分析客户需求,并确定技术方案的目标、范围和交付成果 • 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等 2、技术实现 • 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现 • 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等 • 对编码进行阶段性的讨论和CodeReview,并通过调试优化,推动代码成功部署 • 对开发中和部署后的程序进行必要的维护和迭代,包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等 3、稳定性和性能优化 • 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠 • 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能 4、技术预研 • 跟踪和了解新的产品技术和趋势,根据业务需要提供新的技术支持和建议。 5、技术规划 • 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。

更新于 2025-06-03北京|杭州
logo of alibaba
社招5年以上

1. 基于需求实现AI相关产品的全流程开发,包括但不限于AI应用的架构设计、工程实现、系统部署。 2. 核心参与AI Agent开发,基于大语言模型(LLM)、多模态模型或垂直领域模型,开发具备自主决策能力的AI Agent,支持任务分解、工具调用(如API、数据库)和结果反馈。 3. 持续迭代优化Agent相关技术实现和架构设计,包括但不限于CE优化、RAG优化、调度优化、AI可观测性提升等。 4. 跟踪前沿AI技术(如最新Agent框架和最新基模能力等),推动技术持续创新。

更新于 2025-08-26杭州