小米小米澎湃OS-系统稳定性工程师
任职要求
1.计算机相关专业本科及以上学历 2.五年以上Android平台开发经验,掌握Android平台ANR,JavaCrash, Native Crash, Watchdog问题的分析方法 3.对Android系统知从上到下都有一定的了解,例如App、Framework、Art、Native、Hal、Linux、Arm等. 4.熟悉掌握Framework核心组件(AMS,WMS,PKMS,INPUT)的基本原理 5.熟悉Linux原理,对调度、内存管理、文件系统等有基本的掌握。 6.精通Java/C/C++,了解…
工作职责
交付工作: 1.负责Android平台的系统稳定性体验优化,解决系统死机、重启、系统故障引发的应用稳定性问题,包括不限于重启、panic、javacrash,nativecrash,Watchdog, ANR,冻屏卡死、黑花闪等故障解决。 2.负责稳定性优化,技术攻关,发现并解决各类潜在风险,保证系统安全、稳定、快速运行 问题预防: 1.对历史问题进行复盘,提炼出预防措施。 2.对重点业务的功能进行方案评估,协助业务提前识别稳定性风险并改进 基础建设: 1.结合业界技术发展、用户通点、研发痛点,针对各类稳定性细分疑难故障类型和研发过程中的技术问题,设计并开发领先业界的技术解决方案。 2.负责构建稳定性DFR、DFX、DFT的能力建设。
1、负责字节跳动生活服务的监控治理、稳定性风险巡检等治理工作; 2、负责生活服务研发、运维等规范化稳定性流程体系的架构及建设; 3、参与监控治理、稳定性风险巡检规划及建设; 4、推动字节跳动生活服务SRE文化建设。
1、负责字节跳动生活服务的监控治理、稳定性风险巡检等治理工作; 2、负责生活服务研发、运维等规范化稳定性流程体系的架构及建设; 3、参与监控治理、稳定性风险巡检规划及建设; 4、推动字节跳动生活服务SRE文化建设。
1、负责电商跨域核心链路的稳定性,保证电商核心系统在高速迭代、大促/秒杀等峰值压力下仍能平稳运行; 2、为大型系统构建自动化运营解决方案,从系统设计到上线的整个生命周期内保障系统可靠性; 3、推动提升服务的可靠性、可扩展性以及性能优化,保障系统 SLA; 4、基于业务使用场景,深入优化提供最佳服务治理实践,包含不局限于关键链路性能瓶颈分析、业务问题定位排障、推进系统高可用架构改造升级等。
我们是滴滴网约车技术-稳定性团队,负责网约车公司整体服务稳定性、服务器成本,包含稳定性BP、工具框架、服务器成本三个方向,负责网约车、花小猪整体服务稳定性保障,以及服务器成本优化工作。建设稳定性技术体系,打造高可用系统。为业务又快又稳地发展提供保障。实现企业效益最大化。加入我们,共同打造出行领域坚不可摧的稳定性基石! 岗位职责 1、业务稳定性保障:深入理解核心业务流程(分单、交易、履约等),主动识别潜在稳定性风险,推动架构优化与流程改造。 2、高可用架构设计:规划并落地业务侧多活/异地多中心容灾架构,设计流量控制、降级熔断等稳定性保障方案。 3、风险感知与预防:建设智能监控与风控体系,实现对业务与系统风险的提前感知与自动化干预。 4、故障治理与应急:主导故障演练,优化应急响应机制,快速止损恢复;协助并推动重大故障复盘与根因闭环。 5、稳定性指标与体系建设:建立并完善业务与系统维度的稳定性指标与监控体系,推动数据驱动的稳定性改进。 6、文化与赋能:推广稳定性工程规范,赋能业务与研发团队,将稳定性文化融入日常开发与运营。 7、跨团队协作:与研发、架构、运维、业务团队紧密合作,确保稳定性目标在全链路高效实现。