字节跳动测试开发工程师(云原生方向)-飞书
任职要求
1、本科及以上学历,计算机相关专业,服务端测试开发经验优先; 2、熟悉云原生架构,对Kubernetes、Docker等技术有深入理解和实践经验; 3、具备IaaS、PaaS产品的功能与性能测试经验,涉及组件如MySQL、Redis、ElasticSearch、RocketMQ、对象存储等;熟悉至少一种编程语言(如Python、Go、Java等),具备开发测试平台和工具的能力…
工作职责
1、负责飞书产品依赖的IaaS、PaaS平台的质量保障,涵盖物理硬件和中间件等关键组件; 2、通过流程优化与创新测试方法,建设自动化测试框架和工具平台,提升开发与测试效率,确保PaaS产品的高可用性和稳定性; 3、参与云原生架构的持续演进,涵盖同城双活、容器云等,推动架构的稳定迭代与优化; 4、参与私有化业务规划中的信创项目,协调各方合作,确保项目按时推进,保障整体质量。
1、负责飞书产品依赖的IaaS、PaaS平台的质量保障,涵盖物理硬件和中间件等关键组件; 2、通过流程优化与创新测试方法,建设自动化测试框架和工具平台,提升开发与测试效率,确保PaaS产品的高可用性和稳定性; 3、参与云原生架构的持续演进,涵盖同城双活、容器云等,推动架构的稳定迭代与优化; 4、参与私有化业务规划中的信创项目,协调各方合作,确保项目按时推进,保障整体质量。
1. 稳定性体系规划与落地(质量侧): 负责业务线整体生产安全与稳定性保障体系的建设。作为质量侧代表,与 SRE、业务研发团队紧密协同,制定并落地高可用架构标准。 从业务视角出发,定义稳定性衡量标准(SLA/SLO),并推动技术团队达成稳定性指标(如降低故障率、缩短 MTTR)。 2. 红蓝对抗与全链路演练(质量侧): 主导或参与常态化的红蓝对抗演练。负责设计高复杂度的业务故障场景(蓝军视角/导演视角),验证系统的容灾能力和团队的应急响应能力。 协同 SRE 建设故障注入平台,推动“以演代战”,确保应急预案的有效性和自动化执行率。 3. 变更风险管控: 建立严格的变更管控机制(发布红线、灰度策略、回滚机制)。 建设“变更防御”能力,利用自动化手段拦截高风险代码和配置进入生产环境,治理因变更导致的稳定性问题。 4. 线上巡检与业务核对(BCP): 建设分钟级的业务一致性核对系统,确保在系统未报错但业务逻辑异常(如资金损失、数据不一致)时能快速发现。 补齐监控盲区:不仅关注系统监控(CPU/内存等),更要补齐业务监控盲区。
作为云原生CI/CD方向高级工程师/专家,您将深度参与公司级CI/CD平台的设计、构建、优化和推广。您需要运用您在CI/CD领域的多年经验和对云原生技术的深刻理解,结合平台工程的理念,打造自动化、智能化、自助化的研发交付流水线和开发者平台,赋能业务快速迭代和创新。 主要职责: 1. CI/CD平台建设与优化: - 负责设计、开发、部署和维护公司级CI/CD平台及相关工具链(如Jenkins, GitLab CI, Argo CD, Tekton, Spinnaker等)。 - 持续优化CI/CD流程,提升构建、测试、部署的自动化水平、速度和稳定性。 - 集成代码质量扫描、安全扫描、自动化测试等工具,确保交付质量。 2. 云原生技术实践与推广: - 将云原生理念(如微服务、容器化、不可变基础设施、声明式API)融入CI/CD流程和平台设计。 - 深入研究和应用Kubernetes、Docker、Service Mesh、Serverless等云原生技术,提升资源利用率和系统弹性。 - 推动云原生最佳实践在研发团队中的落地。 3. 平台工程理念落地: - 基于平台工程理念,设计和构建内部开发者平台(IDP),提供标准化的开发、测试、部署环境和工具。 - 为开发者提供自助服务能力,降低认知负荷,提升开发者体验(Developer Experience)。 - 抽象通用能力,构建可复用的组件和模板,赋能不同业务线的快速接入和使用。 4. 技术攻坚与创新: - 解决CI/CD及云原生平台在实施和运维过程中遇到的复杂技术难题。 - 跟踪业界CI/CD、DevOps及云原生领域的最新技术和发展趋势,引入创新方案,持续提升平台能力。 - 参与制定CI/CD和云原生相关的技术规范、标准和SOP。 5. 知识沉淀与分享: - 撰写技术文档,沉淀最佳实践,进行内部技术培训和分享,提升团队整体技术水平。 - 指导和帮助团队其他成员解决技术问题。