logo of aliyun

阿里云阿里云智能-弹性计算高级测试开发专家-北京/杭州

社招全职8年以上云智能集团地点:北京 | 杭州状态:招聘

任职要求


1. 8年以上IT、互联网或云计算领域的开发、运维或测试开发工作经验;
2. 精通Java/Python/Golang,具备丰富的Web平台或大型工具系统开发经验,对多语言技术栈有深入理解;
3. 具备深厚的技术功底,对大型分布式、高并发、高负载、高可用性系统有深刻的理解和丰富的架构设计或质量体系建设经验;
4. 在研发安全生产领域有深入实践,能够主导构建跨产品、大型复杂系统的研发安全生产体系,并能有效应对各类复杂项目环境和突发状况;
5. 深入理解所负责领域的质量技术发展趋势,能识别并解决领域…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 针对ECS异常调度“运维决策大脑”,设计多维的异常调度可验证体系,通过融合存储、心跳、网络状态等多路信号,从根本上解决因单一信号误判导致的业务中断风险,确保自动化决策的精准性;
2. 针对ECS海量线上数据和全链路性能问题,设计和开发创新的测试解决方案与平台,建立精准、高效的性能和稳定性度量体系;
3. 面向失败的可验证性设计,验证系统的韧性架构,尤其针对规模性故障(机房、核心系统依赖),推动核心组件的降级、熔断、故障恢复能力,通过故障注入等方式验证系统的鲁棒性;
4. 作为产品线研发安全生产的构建者,负责在多产品/复杂系统层面构建并落地完善的研发安全生产规范和流程,保障系统的可容灾、可观测、可处置、可运维、可快速恢复;
5. 主导跨产品、大型复杂系统的质量保障工作,组织和推动高水准的稳定性演练(如容灾、红蓝对抗),培养团队的研发安全生产意识和专业能力;
6. 对AIOps/SRE及质量保障领域的技术发展趋势有前瞻性判断,负责测试技术预研、技术难点攻关,推动技术变革与创新,为产品线带来显著收益。
包括英文材料
Java+
Python+
Go+
Web+
还有更多 •••
相关职位

logo of aliyun
社招8年以上云智能集团

产品规划 •负责阿里云ECS实例产品生命周期和发展路线、商业化策略规划,判断产品需求优先级,制定产品路标。 •通过市场分析,洞察市场机会和技术发展趋势、市场容量和竞争格局,定义细分市场。 •通过竞对分析及,识别产品、架构、技术和价格等方面优劣势,制定竞争策略。 •通过调研,洞察用户和客户场景需求,制定产品方案。 产品设计 •理解和抽象客户需求,分析客户场景,负责产品定义、功能和用户体验设计,输出PRD。 •协调研发团队完成产品的开发和测试,完成产品功能上线。 •基于对产品价值和成本的理解,参与价格策略制定和产品定价建议。 产品经营支持 •制定业务拓展策略,制定关键GTM指标,和PdSA共同制定拓展计划,跟踪产品市场表现和竞品情况,通过数据化经营分析提出产品经营改进建议。 •制定生态发展规划,结合产品力、产品优势场景及伙伴能力图谱,为产品设计基于生态的规模化增长及生态各参与者的健康发展策略。 产品上市 •制定产品上架策略,实现产品上架。 •主导产品GTM材料编写,协助PdSA完成赋能、参与产品营销推广。 •标杆建设,负责新产品、新能力的新客户建设,沉淀为可复制材料。 •产品商机挖掘,负责产品的目标市场分析,商机盘点,输出情报。 产品持续改进 •关注客户对产品的使用,合理安排产品需求优先级,推动产品改进、新产品或功能孵化,提升产品易用性,优化产品稳定性、安全性、性能和成本。

更新于 2025-08-09北京|杭州|上海
logo of didi
社招技术

1. 负责万亿级别QPS的分布式缓存/存储集群,支撑公司所有产品线的业务需求; 2. 设计、研发高可用、高性能的缓存/存储架构和中间件,应对弹性扩缩容,秒级故障自动切换,异地多活,分布式事务等极具挑战性的工作内容和方向; 3. 优化系统性能,深入内核,提升基础服务相关资源的使用率,增加系统稳定性,保障业务运行; 4. 设计并研发自动化运维平台,提升运维质量和效率,探索运维自动化和智能化技术和方向。

更新于 2025-04-01北京
logo of kuaishou
社招3年以上D2867

1、负责快手搜推广服务的云原生管控方向,建设云上的平台化服务管控、服务调度能力; 2、结合服务场景设计相关调度策略、智能弹性伸缩能力、潮汐混部能力,提高集群硬件利用率。

更新于 2025-04-03北京
logo of bytedance
社招5年以上A223866A

1、负责Agent系统的稳定性建设,设计高可用架构与容灾降级方案,保障系统在极端场景下稳定运行; 2、优化系统性能,解决分布式场景下的任务调度、数据一致性、故障自愈等挑战,提升服务SLA; 3、建立系统监控、告警及应急响应机制,负责重大故障的排查与恢复; 4、持续优化系统架构,通过代码重构、性能调优等手段提升系统扩展性与可维护性; 5、探索分布式计算、任务调度、流式数据处理等领域的前沿技术(如分布式事务、弹性扩缩容、异构计算等),推动技术成果转化。

更新于 2025-03-11北京