logo of aliyun

阿里云阿里云智能-弹性计算高级开发专家-北京/杭州

社招全职5年以上云智能集团地点:北京 | 杭州状态:招聘

任职要求


• 8年以上IT、互联网、云计算开发相关工作经验,对互联网业务开发、架构设计有深入的理解,面对技术领域的不确定性,具备较好的判断力;
• 具备良好的架构设计能力,能够主导设计开发高并发高可用、高伸缩、低成本的系统架构,主导复杂系统的架构设计和优化工作;
• 在设计、架构、并发、分布式、数据、软工等多个技术领域具备丰富的经验,能快速定位并解决复杂的技术问题,有自己的理解和前瞻性判断;
• 深入理解业务需求,基于技术长期发展,站在不同的视角,从全局视角出发,平衡业务需求和技术架构,坚持使用技术创新突破创造业务价值;
• 有负责过数字供应链平台、ERP平台、数字化经营系统、云计算资源管理系统等相关业务者优先;
• 对云计算相关新技术有激情,学习能力,执行能力强,具备良好的分析问题与解决问题能力,沟通能力强,具备跨团队合作能力。

工作职责


业务支撑
• 负责资源交付平台架构设计与业务建模,服务阿里云全球范围内资源分配和交付需求,提升客户的资源满足度;
• 负责ECS资源经营平台建设,持续提升平台架构和模型的技术先进性,提升阿里云资源运营效率;
• 基于数据驱动,洞察和分析资源使用效率,持续提升资源利用率;
• 持续演进平台和系统领域模型,提升整体业务的技术先进性。
技术方案设计
• 收集、识别、分析内外部客户需求,并确定技术方案的目标、范围和交付成果;
• 基于需求分析,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等。
技术实现
• 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现;
• 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等;
• 基于良好的代码编写规范和架构设计,完善运维保障机制,并针对系统瓶颈进行技术优化。
稳定性和性能优化
• 解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统稳定安全可靠地运行;
• 运用产品优化技术和方法,进行性能优化,提高产品稳定性和性能。
技术预研
• 跟踪和了解新的产品技术和趋势,根据业务需要提供新的技术支持和建议。
技术规划
• 理解业务战略及重点,基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。
包括英文材料
系统设计+
高并发+
高可用+
相关职位

logo of aliyun
社招8年以上云智能集团

1. 针对ECS异常调度“运维决策大脑”,设计多维的异常调度可验证体系,通过融合存储、心跳、网络状态等多路信号,从根本上解决因单一信号误判导致的业务中断风险,确保自动化决策的精准性; 2. 针对ECS海量线上数据和全链路性能问题,设计和开发创新的测试解决方案与平台,建立精准、高效的性能和稳定性度量体系; 3. 面向失败的可验证性设计,验证系统的韧性架构,尤其针对规模性故障(机房、核心系统依赖),推动核心组件的降级、熔断、故障恢复能力,通过故障注入等方式验证系统的鲁棒性; 4. 作为产品线研发安全生产的构建者,负责在多产品/复杂系统层面构建并落地完善的研发安全生产规范和流程,保障系统的可容灾、可观测、可处置、可运维、可快速恢复; 5. 主导跨产品、大型复杂系统的质量保障工作,组织和推动高水准的稳定性演练(如容灾、红蓝对抗),培养团队的研发安全生产意识和专业能力; 6. 对AIOps/SRE及质量保障领域的技术发展趋势有前瞻性判断,负责测试技术预研、技术难点攻关,推动技术变革与创新,为产品线带来显著收益。

更新于 2025-09-17
logo of aliyun
社招8年以上云智能集团

负责核心业务领域的整体技术架构设计、关键技术创新与落地,驱动技术战略与业务目标的深度结合。需要具备卓越的系统架构能力、深刻的业务洞察力、前瞻性的技术视野以及领导复杂技术项目的能力,能够解决重大技术难题,并引领技术团队提升整体效能。具体包括: 1、技术方案设计 · 收集、识别、分析客户需求,深入理解业务本质,进行领域建模和业务抽象,确保技术方案精准支撑业务目标与发展; · 基于需求分析和业务建模,进行技术可行性分析和方案评审,选择合适的技术选型、功能设计、技术架构、设计并决策高扩展性、高可靠、面向未来的数据架构和开发流程等。 2、技术实现 · 基于技术方案的拆解,按照任务目标和产出规范,完成任务/子任务的设计、编码开发和系统功能实现; · 负责核心功能的架构与代码模板的编写,开发与维护系统公用核心模块,技术架构重构、优化等; · 主导或指导复杂数据平台、数据管道、数据服务的设计、研发与优化,确保数据链路的高效、稳定、可扩展,并能有效支持数据分析、决策和智能化应用。 3、稳定性和性能优化 · 制定稳定性策略,寻找并解决产品系统中的潜在风险和瓶颈,覆盖线上疑难杂症问题,确保系统的安全可靠; · 探索产品优化技术和方法,进行性能优化,提高产品稳定性和性能。 4、技术预研 · 跟踪和了解产品技术和趋势,根据业务需要提供技术支持和建议,评估新技术在业务场景的落地可行性及价值。 5、技术规划 · 基于业务需求和技术趋势,主导制定并推动落地支撑业务长期发展的技术架构,确保其具备高可用、高可靠、高拓展性,并能有效沉淀数据资产、驱动业务持续改进。

更新于 2025-09-24
logo of aliyun
社招8年以上云智能集团

产品规划 •负责阿里云ECS实例产品生命周期和发展路线、商业化策略规划,判断产品需求优先级,制定产品路标。 •通过市场分析,洞察市场机会和技术发展趋势、市场容量和竞争格局,定义细分市场。 •通过竞对分析及,识别产品、架构、技术和价格等方面优劣势,制定竞争策略。 •通过调研,洞察用户和客户场景需求,制定产品方案。 产品设计 •理解和抽象客户需求,分析客户场景,负责产品定义、功能和用户体验设计,输出PRD。 •协调研发团队完成产品的开发和测试,完成产品功能上线。 •基于对产品价值和成本的理解,参与价格策略制定和产品定价建议。 产品经营支持 •制定业务拓展策略,制定关键GTM指标,和PdSA共同制定拓展计划,跟踪产品市场表现和竞品情况,通过数据化经营分析提出产品经营改进建议。 •制定生态发展规划,结合产品力、产品优势场景及伙伴能力图谱,为产品设计基于生态的规模化增长及生态各参与者的健康发展策略。 产品上市 •制定产品上架策略,实现产品上架。 •主导产品GTM材料编写,协助PdSA完成赋能、参与产品营销推广。 •标杆建设,负责新产品、新能力的新客户建设,沉淀为可复制材料。 •产品商机挖掘,负责产品的目标市场分析,商机盘点,输出情报。 产品持续改进 •关注客户对产品的使用,合理安排产品需求优先级,推动产品改进、新产品或功能孵化,提升产品易用性,优化产品稳定性、安全性、性能和成本。

更新于 2025-08-09
logo of quark
社招3年以上技术类-开发

1、主导大模型在线推理系统的性能攻坚,构建多节点多GPU的分布式推理架构,实现智能请求调度算法与异构硬件的极致性能调优; 2、研究低bit量化、稀疏化attention等解码加速技术,在保障精度前提下显著降低计算资源消耗; 3、设计高并发场景下的负载均衡方案,构建支持动态扩展的弹性计算架构,优化推理引擎运行时环境,实现毫秒级延迟与高QPS吞吐能力。

更新于 2025-09-30