logo of bytedance

字节跳动技术风险专家(稳定性方向)-互娱质量架构

社招全职4年以上A221444A地点:北京状态:招聘

任职要求


1、4年及以上互联网研发/测试/运维实战经验;
2、主导或深度参与过稳定性架构治理、高可用保障、红蓝攻防等稳定性领域的建设工作,至少在一个领域有深入的理解;
3、优秀的逻辑思维和问题分析能力,良好的沟通表达、团队协作,责任心和执行力强;在擅长领域有较好的技术视野,有创新突破的自驱力;
4、有机器学习及运维开发经验者优先。

工作职责


1、负责互娱研发稳定性治理,识别业务及架构风险,构建防控体系,支撑业务达成目标;
2、承担稳定性蓝军工作,构建风险挖掘、演练、评估体系,推动和参与业务攻防演练及应急能力建设;
3、主导相关工具平台的产品化设计与落地,通过技术与数据驱动稳定性水位的持续提升;
4、负责AIOps方案设计与落地,利用AI技术提升链路依赖、容量、监控等方向治理的效果和效率。
包括英文材料
高可用+
机器学习+
相关职位

logo of bytedance
社招4年以上A100720

1、负责互娱研发质量线蓝军体系建设,打造业务蓝军,主导平台工具化等能力矩阵建设; 2、通过业务及架构视角识别稳定性薄弱点,挖掘并抽象风险场景,推进解决方案的落地及演练验证; 3、负责大规模的红蓝攻防演练,组织红蓝军进行常态化演练,并通过技术手段,不断提升演练效率和效果; 4、构建完善的数据度量评估体系,通过数据驱动,持续推进蓝军攻击能力的丰富及系统稳定性的优化。

更新于 2024-04-24
logo of tencent
社招8年以上CSIG技术

1.负责云产品稳定性治理,保障业务高度稳定性; 2.负责云产品稳定性方向路线规划,洞察领域发展方向,熟悉前沿进展,结合腾讯云现状制定目标达成路线; 3.负责云产品稳定性体系建设,包括不限于流程管理,Devops全生命周期管理,容量管理,告警治理,故障生命周期管理,红蓝对抗演习,混沌演习等; 4.负责云产品稳定性架构优化,可以根据不同业务业务架构,抽象共性,以稳定性为目标制定标准规范,识别风险,拆解任务,验收结果最终达成稳定性目标; 5.负责云产品稳定性组件&工具建设,通过组件或工具提升稳定性治理效率。

更新于 2025-05-23
logo of tuhu
社招8年以上技术

1. 技术战略与架构设计 * 负责物流配送核心系统(TMS相关)的技术规划、架构设计与演进,确保系统高可用、高扩展、高性能,支撑业务稳定运行。 * 主导复杂业务场景下的系统设计,包括路径规划、运力调度、实时轨迹追踪、异常预警等核心模块,解决高并发、分布式事务、数据一致性等技术难点。 * 推动系统架构持续优化,结合物流行业特性(如时效性、动态调度)设计技术方案,支持业务快速迭代与规模化扩展。 2. 团队管理与技术赋能 * 负责15人左右Java技术团队的管理,包括目标制定、任务拆解、人才培养及团队效能提升。 * 建立技术规范与研发流程,推动代码质量、自动化测试、DevOps等工程体系建设,提升团队交付效率。 * 关注团队技术成长,主导关键技术攻关,培养核心骨干成员。 3. 业务协同与创新 * 深入理解物流配送业务需求(如即时配送、城配、干线运输等场景),与产品、算法、运维等部门紧密协作,提供高效技术解决方案。 * 探索大数据、AI调度、IoT等技术与配送系统的结合,推动业务创新与效率提升。 4. 跨部门协作与资源统筹 * 协调上下游系统(如WMS、OMS、结算系统等)的技术对接,确保端到端流程顺畅。 * 主导重大项目落地,把控技术风险,保障系统稳定性与交付质量。

更新于 2025-06-23
logo of meituan
社招5年以上核心本地商业-业

1.负责配送安全治理平台技术架构设计、需求把控,将业务需求拆解细化并实施; 2.主导安全治理平台系统规划、性能优化、稳定性等工作,制定工作计划,为项目结果负责; 3.参与技术决策,技术选型,技术架构和技术风险评估; 4.负责解决项目中关键问题和技术难题,线上疑难问题排查和解决,并给出合理的知道指导和改进建议; 5.推进跨团队项目协作并取得成果;

更新于 2025-07-02