logo of ctrip

携程云原生平台研发工程师(FinOps方向)(MJ031639)

社招全职技术团队开发地点:上海状态:招聘

任职要求


1.熟练掌握JavaSpring Boot框架,具备扎实的工程能力,有利用Python进行简单数据分析经验者优先;
2.熟悉MySQL、Redis等主流数据库和数据分析引擎,具备良好的数据建模能力,在此基础上熟悉S…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责携程混合云架构下的云管平台的模块设计,开发及日常维护,包括租户权限管理、资源管理、资源配额管理等关键模块;
2.负责多云FinOps计量计费系统的模块设计,开发及日常维护,包括资源使用追踪、成本归属等关键模块;
3.参与数据分析与运营系统构建,为成本洞察/预估及预算控制提供技术能力支撑;
4.持续优化平台性能,稳定性与用户体验,保障系统高可用与数据一致性;
包括英文材料
Java+
Spring Boot+
Python+
数据分析+
MySQL+
还有更多 •••
相关职位

logo of amap
社招3年以上技术类-运维

高德运维研发团队主要负责高德运维平台的建设,对服务稳定性和用户体验负责,主要围绕如下几个方向进行卓有成效的工作: - 高可用方向:围绕混沌工程、故障自愈、全链路故障定位 等前沿技术方向进行平台化建设和智能运维大规模业务落地,提升系统的稳定性水平。 - 资源管理方向:将机器学习技术应用于超大规模集群的资源管理实践中,围绕 资源画像、应用画像、容量管理、全自动化弹性伸缩 等前沿方向进行算法优化和平台化建设。 - 云原生方向:基于实际业务场景,建设云原生时代的云上运维平台,提升云上业务在变更发布、资源调度 等方面的效率。

更新于 2025-11-12北京
logo of aliyun
社招10年以上云智能集团

岗位定位 当AI Agent开始7x24小时自主运行研发任务,云原生基础设施的使用方式正在被彻底重新定义。我们需要一位能为Agent原生时代设计全新用云范式的架构师。 您不是从零构建云原生底座,而是站在已有的云原生基础设施之上,将云服务、商业化链路、资源调度、稳定性运维等复杂能力,以Agent友好的方式重新封装为高效、可编排、成本最优的标准化接口与工具链。您的核心使命是:让AI Agent能像最优秀的工程师一样,通过IaC、CLI、API自主操控云基础设施,并为7x24小时托管式Agent原生研发模式提供强大的Harness架构与配套的研发流水线。 这是一个定义"Agent如何用云"的前沿架构角色——您将在AgentSRE、FinOps、IaC-as-Agent-Interface等方向上探索行业最佳实践,让基础设施从"人用的工具"进化为"Agent的原生操作系统"。 核心职责 Harness架构升级与治理 ● 设计并持续演进面向Agent原生研发模式的Harness架构——定义Agent任务的编排框架、执行沙箱、权限边界与生命周期管理,支撑7x24小时托管式Agent自主运行 ● 构建Agent原生的研发流水线与工具链:从代码生成、构建测试、部署发布到线上运维,全链路具备Agent可调用、可观测、可回滚的能力 ● 建立Harness架构的治理机制——Agent行为审计、策略门控(Policy-as-Code)、异常熔断与人工接管逻辑,确保自主运行的安全性与可控性 云原生基座封装与高效用云 ● 将已有云原生基础服务(计算、存储、网络、中间件等)封装为Agent友好的标准化接口——IaC模块、CLI工具集、声明式API,让Agent能通过自然的工具调用方式完成基础设施操控 ● 设计"CLI Anything"能力层:将云平台的运维操作、配置变更、环境管理等全面CLI化和API化,消除Agent操作云资源的认知壁垒与操作门槛 ● 主导云服务商业化链路的封装与优化——资源开通、计量计费、多租户隔离、SLA管理等能力的标准化接入,让Agent能自主完成从资源申请到交付的全流程 资源预测与成本治理(FinOps) ● 构建AI驱动的云资源预测与规划体系——基于业务负载模式、Agent任务调度特征,实现资源需求的智能预测与提前调度 ● 主导FinOps体系建设:建立多维度成本归因、实时用量监控与预算预警机制,将成本可见性深入到每个Agent任务和每条业务线 ● 设计并落地成本优化策略——弹性伸缩策略优化、预留实例与按需实例的智能组合、闲置资源自动回收、跨可用区调度,在保障SLA的前提下持续降低用云成本 稳定性与可观测性体系 ● 建立面向Agent原生运行环境的AgentSRE体系——定义Agent服务的SLO/SLI,构建Agent任务执行的全链路可观测性(执行日志、资源消耗、异常检测、性能剖析) ● 设计Agent驱动的智能运维能力:异常自动诊断、故障自愈、容量自动调整,让Agent不仅是"被运维的对象",更是"参与运维的主体" ● 建立云上应用的容灾与高可用方案,覆盖多可用区部署、故障切换、数据一致性保障,确保核心业务的持续稳定运行 组织建设与技术文化 ● 搭建兼具云原生工程深度与Agent系统理解力的架构团队,主导核心人才引进与梯队建设 ● 推动Agent原生研发范式在团队和公司的落地——建立AGENTS.md等标准化协作规范,让Agent成为研发流程中的一等公民 ● 营造追求工程卓越、拥抱自动化与创新的技术文化,积极参与云原生与Agent原生工程领域的行业交流

更新于 2026-04-07杭州
logo of aligenie
社招10年以上

岗位定位 当AI Agent开始7x24小时自主运行研发任务,云原生基础设施的使用方式正在被彻底重新定义。我们需要一位能为Agent原生时代设计全新用云范式的架构师。 您不是从零构建云原生底座,而是站在已有的云原生基础设施之上,将云服务、商业化链路、资源调度、稳定性运维等复杂能力,以Agent友好的方式重新封装为高效、可编排、成本最优的标准化接口与工具链。您的核心使命是:让AI Agent能像最优秀的工程师一样,通过IaC、CLI、API自主操控云基础设施,并为7x24小时托管式Agent原生研发模式提供强大的Harness架构与配套的研发流水线。 这是一个定义"Agent如何用云"的前沿架构角色——您将在AgentSRE、FinOps、IaC-as-Agent-Interface等方向上探索行业最佳实践,让基础设施从"人用的工具"进化为"Agent的原生操作系统"。 核心职责 Harness架构升级与治理 ● 设计并持续演进面向Agent原生研发模式的Harness架构——定义Agent任务的编排框架、执行沙箱、权限边界与生命周期管理,支撑7x24小时托管式Agent自主运行 ● 构建Agent原生的研发流水线与工具链:从代码生成、构建测试、部署发布到线上运维,全链路具备Agent可调用、可观测、可回滚的能力 ● 建立Harness架构的治理机制——Agent行为审计、策略门控(Policy-as-Code)、异常熔断与人工接管逻辑,确保自主运行的安全性与可控性 云原生基座封装与高效用云 ● 将已有云原生基础服务(计算、存储、网络、中间件等)封装为Agent友好的标准化接口——IaC模块、CLI工具集、声明式API,让Agent能通过自然的工具调用方式完成基础设施操控 ● 设计"CLI Anything"能力层:将云平台的运维操作、配置变更、环境管理等全面CLI化和API化,消除Agent操作云资源的认知壁垒与操作门槛 ● 主导云服务商业化链路的封装与优化——资源开通、计量计费、多租户隔离、SLA管理等能力的标准化接入,让Agent能自主完成从资源申请到交付的全流程 资源预测与成本治理(FinOps) ● 构建AI驱动的云资源预测与规划体系——基于业务负载模式、Agent任务调度特征,实现资源需求的智能预测与提前调度 ● 主导FinOps体系建设:建立多维度成本归因、实时用量监控与预算预警机制,将成本可见性深入到每个Agent任务和每条业务线 ● 设计并落地成本优化策略——弹性伸缩策略优化、预留实例与按需实例的智能组合、闲置资源自动回收、跨可用区调度,在保障SLA的前提下持续降低用云成本 稳定性与可观测性体系 ● 建立面向Agent原生运行环境的AgentSRE体系——定义Agent服务的SLO/SLI,构建Agent任务执行的全链路可观测性(执行日志、资源消耗、异常检测、性能剖析) ● 设计Agent驱动的智能运维能力:异常自动诊断、故障自愈、容量自动调整,让Agent不仅是"被运维的对象",更是"参与运维的主体" ● 建立云上应用的容灾与高可用方案,覆盖多可用区部署、故障切换、数据一致性保障,确保核心业务的持续稳定运行 组织建设与技术文化 ● 搭建兼具云原生工程深度与Agent系统理解力的架构团队,主导核心人才引进与梯队建设 ● 推动Agent原生研发范式在团队和公司的落地——建立AGENTS.md等标准化协作规范,让Agent成为研发流程中的一等公民 ● 营造追求工程卓越、拥抱自动化与创新的技术文化,积极参与云原生与Agent原生工程领域的行业交流

更新于 2026-04-07杭州
logo of xiaohongshu
校招基础后端

1、负责打造业界一流的 DevOPS 平台工程体系; 2、参与公司级统一建站、发布运维、变更管控等相关平台的系统设计、研发实现和稳定性保障; 3、通过技术工程和平台建设,提升公司日常研发运维、活动保障、机房迁移等场景的实施效率和质量; 4、洞察同领域业务发展方向,引入大模型提升 DevOPS 产品能力; 5、负责小红书多云架构下Finops平台技术架构和设计方案; 6、构建一流的技术服务商品体系,提升技术成本洞察及决策效率。

更新于 2025-09-13上海|杭州|北京