logo of bytedance

字节跳动科学计算云原生工程师-Seed

社招全职3年以上A96893地点:北京状态:招聘

任职要求


1、本科及以上学历,计算机相关专业,拥有3年以上研发领域工作经验;
2、熟练掌握Golang,具备扎实的编程能力和良好的编码习惯;
3、熟悉K8s及其相关生态,掌握k8s的二次开发;
4、具备云计算中虚拟化,云原生,安…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责建设面向科学计算场景的、支持高通量任务运行的混合云算力平台;
2、提供基于云原生的弹性资源管理服务,实现对公司内外多种云规格、GPU规格的对接与管理,持续提升集群资源利用率;
3、深度参与AI4S应用产品建设,为业务输出输送高效、灵活的云基础能力支撑。
包括英文材料
学历+
Go+
编程规范+
还有更多 •••
相关职位

logo of aliyun
社招10年以上云智能集团

岗位定位 当AI Agent开始7x24小时自主运行研发任务,云原生基础设施的使用方式正在被彻底重新定义。我们需要一位能为Agent原生时代设计全新用云范式的架构师。 您不是从零构建云原生底座,而是站在已有的云原生基础设施之上,将云服务、商业化链路、资源调度、稳定性运维等复杂能力,以Agent友好的方式重新封装为高效、可编排、成本最优的标准化接口与工具链。您的核心使命是:让AI Agent能像最优秀的工程师一样,通过IaC、CLI、API自主操控云基础设施,并为7x24小时托管式Agent原生研发模式提供强大的Harness架构与配套的研发流水线。 这是一个定义"Agent如何用云"的前沿架构角色——您将在AgentSRE、FinOps、IaC-as-Agent-Interface等方向上探索行业最佳实践,让基础设施从"人用的工具"进化为"Agent的原生操作系统"。 核心职责 Harness架构升级与治理 ● 设计并持续演进面向Agent原生研发模式的Harness架构——定义Agent任务的编排框架、执行沙箱、权限边界与生命周期管理,支撑7x24小时托管式Agent自主运行 ● 构建Agent原生的研发流水线与工具链:从代码生成、构建测试、部署发布到线上运维,全链路具备Agent可调用、可观测、可回滚的能力 ● 建立Harness架构的治理机制——Agent行为审计、策略门控(Policy-as-Code)、异常熔断与人工接管逻辑,确保自主运行的安全性与可控性 云原生基座封装与高效用云 ● 将已有云原生基础服务(计算、存储、网络、中间件等)封装为Agent友好的标准化接口——IaC模块、CLI工具集、声明式API,让Agent能通过自然的工具调用方式完成基础设施操控 ● 设计"CLI Anything"能力层:将云平台的运维操作、配置变更、环境管理等全面CLI化和API化,消除Agent操作云资源的认知壁垒与操作门槛 ● 主导云服务商业化链路的封装与优化——资源开通、计量计费、多租户隔离、SLA管理等能力的标准化接入,让Agent能自主完成从资源申请到交付的全流程 资源预测与成本治理(FinOps) ● 构建AI驱动的云资源预测与规划体系——基于业务负载模式、Agent任务调度特征,实现资源需求的智能预测与提前调度 ● 主导FinOps体系建设:建立多维度成本归因、实时用量监控与预算预警机制,将成本可见性深入到每个Agent任务和每条业务线 ● 设计并落地成本优化策略——弹性伸缩策略优化、预留实例与按需实例的智能组合、闲置资源自动回收、跨可用区调度,在保障SLA的前提下持续降低用云成本 稳定性与可观测性体系 ● 建立面向Agent原生运行环境的AgentSRE体系——定义Agent服务的SLO/SLI,构建Agent任务执行的全链路可观测性(执行日志、资源消耗、异常检测、性能剖析) ● 设计Agent驱动的智能运维能力:异常自动诊断、故障自愈、容量自动调整,让Agent不仅是"被运维的对象",更是"参与运维的主体" ● 建立云上应用的容灾与高可用方案,覆盖多可用区部署、故障切换、数据一致性保障,确保核心业务的持续稳定运行 组织建设与技术文化 ● 搭建兼具云原生工程深度与Agent系统理解力的架构团队,主导核心人才引进与梯队建设 ● 推动Agent原生研发范式在团队和公司的落地——建立AGENTS.md等标准化协作规范,让Agent成为研发流程中的一等公民 ● 营造追求工程卓越、拥抱自动化与创新的技术文化,积极参与云原生与Agent原生工程领域的行业交流

更新于 2026-04-07杭州
logo of aligenie
社招10年以上

岗位定位 当AI Agent开始7x24小时自主运行研发任务,云原生基础设施的使用方式正在被彻底重新定义。我们需要一位能为Agent原生时代设计全新用云范式的架构师。 您不是从零构建云原生底座,而是站在已有的云原生基础设施之上,将云服务、商业化链路、资源调度、稳定性运维等复杂能力,以Agent友好的方式重新封装为高效、可编排、成本最优的标准化接口与工具链。您的核心使命是:让AI Agent能像最优秀的工程师一样,通过IaC、CLI、API自主操控云基础设施,并为7x24小时托管式Agent原生研发模式提供强大的Harness架构与配套的研发流水线。 这是一个定义"Agent如何用云"的前沿架构角色——您将在AgentSRE、FinOps、IaC-as-Agent-Interface等方向上探索行业最佳实践,让基础设施从"人用的工具"进化为"Agent的原生操作系统"。 核心职责 Harness架构升级与治理 ● 设计并持续演进面向Agent原生研发模式的Harness架构——定义Agent任务的编排框架、执行沙箱、权限边界与生命周期管理,支撑7x24小时托管式Agent自主运行 ● 构建Agent原生的研发流水线与工具链:从代码生成、构建测试、部署发布到线上运维,全链路具备Agent可调用、可观测、可回滚的能力 ● 建立Harness架构的治理机制——Agent行为审计、策略门控(Policy-as-Code)、异常熔断与人工接管逻辑,确保自主运行的安全性与可控性 云原生基座封装与高效用云 ● 将已有云原生基础服务(计算、存储、网络、中间件等)封装为Agent友好的标准化接口——IaC模块、CLI工具集、声明式API,让Agent能通过自然的工具调用方式完成基础设施操控 ● 设计"CLI Anything"能力层:将云平台的运维操作、配置变更、环境管理等全面CLI化和API化,消除Agent操作云资源的认知壁垒与操作门槛 ● 主导云服务商业化链路的封装与优化——资源开通、计量计费、多租户隔离、SLA管理等能力的标准化接入,让Agent能自主完成从资源申请到交付的全流程 资源预测与成本治理(FinOps) ● 构建AI驱动的云资源预测与规划体系——基于业务负载模式、Agent任务调度特征,实现资源需求的智能预测与提前调度 ● 主导FinOps体系建设:建立多维度成本归因、实时用量监控与预算预警机制,将成本可见性深入到每个Agent任务和每条业务线 ● 设计并落地成本优化策略——弹性伸缩策略优化、预留实例与按需实例的智能组合、闲置资源自动回收、跨可用区调度,在保障SLA的前提下持续降低用云成本 稳定性与可观测性体系 ● 建立面向Agent原生运行环境的AgentSRE体系——定义Agent服务的SLO/SLI,构建Agent任务执行的全链路可观测性(执行日志、资源消耗、异常检测、性能剖析) ● 设计Agent驱动的智能运维能力:异常自动诊断、故障自愈、容量自动调整,让Agent不仅是"被运维的对象",更是"参与运维的主体" ● 建立云上应用的容灾与高可用方案,覆盖多可用区部署、故障切换、数据一致性保障,确保核心业务的持续稳定运行 组织建设与技术文化 ● 搭建兼具云原生工程深度与Agent系统理解力的架构团队,主导核心人才引进与梯队建设 ● 推动Agent原生研发范式在团队和公司的落地——建立AGENTS.md等标准化协作规范,让Agent成为研发流程中的一等公民 ● 营造追求工程卓越、拥抱自动化与创新的技术文化,积极参与云原生与Agent原生工程领域的行业交流

更新于 2026-04-07杭州
logo of bytedance
社招A45411

1、参与大规模分布式时序引擎系统设计和开发以及优化,保障系统在极高并发访问的场景下低延迟、高可用、高吞吐、可扩展; 2、基于云原生基础设施,建设弹性Serverless的平台化能力,为用户提供简单、高效、易用的分布式数据服务; 3、深度理解和支持内外部客户的业务需求,打造标杆客户,培养开发者生态; 4、学习和吸纳业界优秀的开源技术和理论成果,敢于探索、创新,拓展和丰富产品的能力。

更新于 2025-02-24上海
logo of baidu
社招3年以上IDG

-负责自动驾驶仿真平台前端开发 -开发高精度3D可视化仿真引擎,支持传感器数据(LiDAR、Camera、Radar)的动态渲染与实时交互,实现仿真场景的分布式可视化展示。 -Kubernetes(k8s)与云服务管理 -基于K8s搭建容器化仿真服务平台,微服务化架构,实现仿真服务的弹性伸缩、负载均衡与故障恢复 -跨团队协作与技术沉淀 -与算法团队紧密合作,确保仿真环境与自动驾驶感知、规划、控制模块的精准对接。 -主导技术文档编写与开源工具链研究,推动团队技术标准化。

更新于 2025-04-10北京