百度私有化部署交付平台后端工程师(GO方向)(J84369)
任职要求
-本科及以上学历,计算机科学、软件工程或相关专业 -2 年及以上后端开发经验,有使用golang独立开发平台的经验, 熟练掌握 golang, python 等开发语言 -熟练使用K8S,熟悉容器化技术(如 Docker)及微服务架构,具有私有化部署经验者优先 -有通过PXE 安装 Linux操作系统装机安装和配置经验,有网络设备配置能力交换机,熟悉各种网络、路由协议 -具备良好的系统设计、编码规范和单元测试习惯,能够编写高质量代码 -具备丰富的分布式系统、微服务架构、数据库技术、缓存技术、消息队列等技术经验 -具备良好的沟通能力和团队协作精神,乐于分享和技术创新 -有精通装机和网络相关协议,有装机部署平台、网络部署平台等开发经验者优先
工作职责
-参与私有化部署平台的后端架构设计、开发和优化,主要使用 Go 语言 -设计并开发企业级操作系统自动化部署平台,支持大规模服务器环境的高效安装和配置 -优化操作系统定制和部署流程,提高硬件适配性和部署效率,简化安装过程 -负责操作系统的安装工具链研发(如PXE、Tinkerbell等),并进行定制化开发。 -深入研究并解决复杂的系统安装和启动问题,包括网络引导、硬件初始化、文件系统挂载等关键环节 -根据不同硬件架构的需求(x86、ARM、DPU等),定制化开发操作系统内核和驱动支持 -深入理解 Kubernetes (K8s) 的核心概念,并将其与业务需求紧密结合,具备封装 K8s 的接口和服务的能力 -可独立设计并完成子系统的开发,编写高质量的代码,确保代码的可维护性和高效性能 -参与系统的性能优化、故障排查及技术难题攻关,保证平台的高可用性和稳定性
-岗位核心目标:主导设计、构建并优化企业级私有化交付运维平台架构,实现资源统一纳管、自动化部署、可观测性及全生命周期管理,提升客户私有化交付效率与稳定性 -关键职责如下: - 架构设计与开发 -设计高可用、可扩展的私有化交付平台架构 -开发核心模块:资源编排引擎、自动化部署框架、自动化装机引擎 -构建多集群管理能力,实现跨地域私有化项目统一管控 -技术栈整合:整合IaC工具链、容器编排、工作流编排 -交付体验优化:开发可视化交付控制台,提供部署、变更、运维一体化操作界面 -实现交付流程可观测性:部署进度追踪、实时日志、资源拓扑自动生成 -工程效能提升: -建设 CI/CD流水线,支持平台自身的持续集成与灰度发布 -探索基于大模型的智能部署运维架构:自动化任务编排、根因分析、排错指引 -技术领导:主导技术选型及架构评审,制定开发规范
- 参与私有化部署平台的后端架构设计、开发和优化,主要使用 Go 语言。 - 设计并开发企业级操作系统自动化部署平台,支持大规模服务器环境的高效安装和配置。 - 优化操作系统定制和部署流程,提高硬件适配性和部署效率,简化安装过程。 - 深入理解 Kubernetes (K8s) 的核心概念,并将其与业务需求紧密结合,具备封装 K8s 的接口和服务的能力。 - 可独立设计并完成子系统的开发,编写高质量的代码,确保代码的可维护性和高效性能。 - 参与系统的性能优化、故障排查及技术难题攻关,保证平台的高可用性和稳定性。
职位描述: 我们正在寻找一位经验丰富的python/go(两种语言兼备)工程师,加入我们的团队,负责混合云计算底座平台的核心开发。该平台主要支持toB业务应用的私有化部署/运维/日志监控等功能。候选人需具备扎实的后端开发技能和云原生相关技术(Kubernetes),同时熟悉常见前端技术(React)以实现高效的全栈开发和系统交付能力。 主要职责: ● 负责混合云计算平台核心模块的设计与开发,混合云计算平台包括k8s底座、常用中间件、各类数据库等核心功能组件。 ● 负责平台后端核心api接口实现,参与前端React应用的开发,确保用户体验和系统功能的高效整合。 ● 推动云原生技术在平台中的落地,帮助业务应用云原生化改造(helm charts)及常见问题排查解决。 ● 与产品、测试及运维团队紧密协作,推动项目高质量交付。 ● 持续改进平台架构和代码质量,提升系统性能与扩展性。"
-作为百度私有云在客户侧的售后一号位,全流程深入了解大型企业业务场景,与客户的系统运维,应用架构等人员合作,提供私有云产品的售后运维,包括但不限于组织现场进行云平台变更,对接客户需求 -基于百度私有云&AI的产品线、技术体系,帮助企业级客户制定IT架构和业务流程,包括定制的最佳实践、异常处理机制和问题应急预案等。帮助客户深度理解云服务,并持续帮助客户提升技术能力 -保障百度云平台的稳定运行,负责客户云平台的故障应急响应,后端协调,应急止损,协调产研出具故障报告,负责客户侧汇报和复盘 -推动百度云智能产品不断优化,解决客户使用云计算服务和解决方案过程中的技术问题,不断完善问题处理机制和流程,与云服务专家、产品专家直接合作,确保企业技术问题高效地解决 -现场一线驻场人员的日常运维工作管理,以及绩效考核,现场运维流程制定等运维管理工作