高德地图高德-AI Agent稳定性方向Java/Golang-AI 专项
任职要求
● 熟悉分布式系统的设计和应用,对搜索、推荐、缓存、消息有一定实践经验 ● 5年以上 Java / Golang / Python 开发经验,语言基础扎实,熟悉社区常用框架,有项目经验 个人素质 ● 对开发工作富有激情,…
工作职责
负责构建和优化企业级稳定性保障体系,通过 AI 赋能的智能运维平台、缓存容灾能力、攻防演练系统等技术手段,全方位提升微服务架构下的系统可用性和故障恢复能力。 ● AI 驱动的运维体系建设复杂微服务场景下,基于 AI 的线上运维体系,提升异常发现和恢复能力 ● AI Agent信息缓存服务建设地理位置信息场景下的通用缓存和降级能力,支撑海量地理数据的容灾能力 ● 智能运维体系建设 - 基于 AI 技术提升异常发现和自动恢复能力 ● 容灾能力建设 - 构建缓存降级、地理容灾等高可用基础设施 ● 演练平台建设 - 通过红蓝攻防和压测评测,提前发现系统薄弱点 ● 稳定性保障 - 作为服务稳定性的最后一道防线,确保业务连续性
1.负责阿里云容器平台在AI基础设施与应用架构方向的产品研发与技术演进; 2.主导大规模异构资源(GPU/NPU/RDMA等)集群的调度、管理与性能优化,提升资源利用效率、系统稳定性与运行性能; 3.设计并开发面向AI Agent场景的Serverless容器算力产品; 4.推动云原生AI领域前沿技术预研、落地及开源生态建设,持续引领技术创新与行业实践。
我们正在寻找一位经验丰富的高级开发工程师,加入我们的AI技术团队,负责Agent框架平台的研发工作。您将参与设计和实现先进的Agent系统架构,开发智能Agent框架和相关工具链,推动多Agent协同能力的突破。你负责的内容会包括以下但不限于: 1.负责Agent框架核心能力的设计与开发,包括异步化框架、执行引擎的实现与优化 2.研发Agent Development Kit (ADK),提供完善的开发工具和接口 3.设计并实现multi-agent协同框架,解决Agent间的通信、协作和资源分配问题 4.开发和维护MCP (Model Control Protocol) Server,管理模型调用和资源调度 -参与制定Agent能力评估标准,构建测试框架和基准测试 5.优化Agent系统性能,提高可扩展性和稳定性 6.与产品、算法团队紧密合作,将前沿AI研究成果落地到框架中
团队介绍:我们致力于建设行业顶尖的低代码平台,加速企业数字化进程。让懂业务的人无需开发、快速构建出贴合业务需求的应用,助力业务人员自我价值最大化;将研发人员从低效重复的工作中解放出来,改变低效的研发模式;打通企业数据、减少数据孤岛,让企业掌握快速创新的主动权。 1、负责企业应用AI辅助搭建方向的开发,参与Code Agent、Code RAG等能力的建设; 2、跟进AI大模型前沿技术、开源方案及其在代码生成、应用搭建领域的应用; 3、参与解决方案的制定,推动产品的稳定性、性能、开放性和扩展性建设。