字节跳动平台开发工程师/专家-DevOps方向
任职要求
1、本科及以上学历,计算机、通信等相关专业,具备良好的业务沟通和分析解决问题的能力; 2、熟练掌握至少一种主流编程语言、框架及相关生态(如C/C++/PHP/Java/Golang等),有较强的架构能力和良好的代码规范; 3、理解常规的架构设计思想,包括但不限于服务化、异步、高可用、可扩展等,有系统性解决问题的思维,有良好的抽象化思维能力和领域建模能力;熟悉常用的组件,包括但不限于Redis、Kafka等; 4、熟练掌握 DevOps 理念和实践,熟悉 CI/CD 流程,能够设计和实现自动化部署、自动化测试等流程; 5、具备较强的沟通能力和团队合作精神,能够与不同领域的人员协同工作; 6、具备较强的学习能力和解决问题能力,能够独立分析和解决问题。
工作职责
1、参与公司自动化工程效能平台的架构设计与研发; 2、参与任务调度、任务执行、结果分析等后端模块的设计与研发; 3、参与产品需求分析,设计系统技术方案,提升平台运营效率; 4、挖掘业务痛点,以技术为驱动力解决痛点问题。
作为云原生CI/CD方向高级工程师/专家,您将深度参与公司级CI/CD平台的设计、构建、优化和推广。您需要运用您在CI/CD领域的多年经验和对云原生技术的深刻理解,结合平台工程的理念,打造自动化、智能化、自助化的研发交付流水线和开发者平台,赋能业务快速迭代和创新。 主要职责: 1. CI/CD平台建设与优化: - 负责设计、开发、部署和维护公司级CI/CD平台及相关工具链(如Jenkins, GitLab CI, Argo CD, Tekton, Spinnaker等)。 - 持续优化CI/CD流程,提升构建、测试、部署的自动化水平、速度和稳定性。 - 集成代码质量扫描、安全扫描、自动化测试等工具,确保交付质量。 2. 云原生技术实践与推广: - 将云原生理念(如微服务、容器化、不可变基础设施、声明式API)融入CI/CD流程和平台设计。 - 深入研究和应用Kubernetes、Docker、Service Mesh、Serverless等云原生技术,提升资源利用率和系统弹性。 - 推动云原生最佳实践在研发团队中的落地。 3. 平台工程理念落地: - 基于平台工程理念,设计和构建内部开发者平台(IDP),提供标准化的开发、测试、部署环境和工具。 - 为开发者提供自助服务能力,降低认知负荷,提升开发者体验(Developer Experience)。 - 抽象通用能力,构建可复用的组件和模板,赋能不同业务线的快速接入和使用。 4. 技术攻坚与创新: - 解决CI/CD及云原生平台在实施和运维过程中遇到的复杂技术难题。 - 跟踪业界CI/CD、DevOps及云原生领域的最新技术和发展趋势,引入创新方案,持续提升平台能力。 - 参与制定CI/CD和云原生相关的技术规范、标准和SOP。 5. 知识沉淀与分享: - 撰写技术文档,沉淀最佳实践,进行内部技术培训和分享,提升团队整体技术水平。 - 指导和帮助团队其他成员解决技术问题。
1、负责快手商业化的资金体系建设以及相关方向的解决方案研发工作; 2、理解资金业务内容,承担业务相关的技术攻坚,主导核心服务的编码和上线; 3、积极主动,通过对财务资金业务的深入理解发现系统的瓶颈,能够主动发现系统问题并进行推进解决; 4、对现有业务系统的架构进行抽象和升级,提升系统的效率和平台化能力,提升整体的研发效率。
我们正在寻找具备深厚技术功底、前瞻性视野和丰富实战经验的DevOps平台工程专家,加入我们致力于构建智能化研发基础设施的核心团队。在这里,你将主导下一代AI驱动的CI/CD平台与智能运维系统的设计与落地,推动软件研发流程向自动化、可观测性、自愈能力和数据驱动决策全面进化。 作为团队的技术骨干,你将: 1. 设计并构建高可用、智能化的CI/CD平台 主导持续集成与持续交付系统的架构演进,支持大规模分布式研发协作;探索机器学习在构建失败预测、测试用例智能推荐、资源调度优化等场景的应用,显著提升交付效率与稳定性。 2. 打造企业级智能化运维(AIOps)体系 基于Python、Go等语言,构建自动化运维工具链与平台化能力,实现基础设施即代码(IaC);引入异常检测、根因分析、故障传播图谱等AI算法,提升系统可观测性与故障响应速度,推动运维从“被动响应”向“主动预防”转变。 3. 构建全链路智能监控与自愈系统 设计并落地覆盖应用、服务、资源的端到端监控体系,集成Prometheus、Grafana、ELK、OpenTelemetry等主流技术栈;结合时序预测(LSTM、Prophet)、无监督异常检测(Isolation Forest、One-Class SVM)等模型,实现性能瓶颈预警、自动诊断与部分场景的闭环自愈。 4. 推动MLOps与DevOps深度融合 主导机器学习模型训练流水线(ML Pipeline)与模型服务化(Model Serving)平台建设,设计模型版本管理、A/B测试、流量灰度、监控告警与快速回滚机制,支撑AI能力高效、稳定地规模化落地。