阿里云阿里云智能-java研发工程师/专家-稳定性工具平台

社招全职5年以上云智能集团2025-09-22地点：杭州状态：招聘

扫码手机上打开

任职要求

研发架构与开发能力
1. 3-5年以上JAVA开发经验，精通JAVA语言，熟悉shell、python等脚本语言；
2. 精通各种主流JAVA框架，包括spring、netty、hibernate、mybatis等，对JVM原理有深层次的理解；
3. 具备系统架构能力，熟悉分布式容错、分布式缓存、高并发等主流技术；
4. 有分布式系统经验者优先。
5. 熟悉软件工程过程管理，包括从需求分析到产品发布；
6. 具备变更管控相关系统的开发经验者优先。

智能体架构与开…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、技术方案设计
• 收集、识别、分析客户需求，并确定技术方案的目标、范围和交付成果
• 基于需求分析，进行技术可行性分析和方案评审，选择合适的技术选型、功能设计、技术架构、数据架构和开发流程等
2、技术实现
• 基于技术方案的拆解，按照任务目标和产出规范，完成任务/子任务的设计、编码开发和系统功能实现
• 负责核心功能的架构与代码模板的编写，开发与维护系统公用核心模块，技术架构重构、优化等
• 对编码进行阶段性的讨论和CodeReview，并通过调试优化，推动代码成功部署
• 对开发中和部署后的程序进行必要的维护和迭代，包括值班oncall、升级工单处置、bug排查、问题诊断、产品体验改善、性能和成本优化等
3、稳定性和性能优化
• 制定稳定性策略，寻找并解决产品系统中的潜在风险和瓶颈，覆盖线上疑难杂症问题，确保系统的安全可靠
• 运用产品优化技术和方法，进行性能优化，提高产品稳定性和性能
4、技术预研
• 跟踪和了解新的产品技术和趋势，根据业务需要提供新的技术支持和建议。
5、技术规划
• 理解业务战略及重点，基于业务需求作出高可用、高可靠、高拓展性的技术架构规划和落地。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Java+

Bash+

Python+

脚本+

Spring+

Hibernate+

MyBatis+

还有更多 •••

登录查看完整学习资料

相关职位

技术专家/资深Java研发工程师（保险智能体平台）(J250820025)

社招3年以上技术

1. 负责保险智能体平台的整体搭建，主导技术架构设计及模块开发，实现智能客服、智能销售、智能理赔等系统能力，深度赋能保险业务； 2. 参与技术规划，技术难题攻关，升级与重构系统，保障业务需求交付、代码高质量和系统的线上运行稳定性；

更新于 2025-09-29北京

网商银行-数据研发工程师/专家-杭州

社招3年以上技术类-数据

1、负责网商银行数据体系和解决方案建设，赋能业务数字化运营，提升运营效率，保障数据的质量和稳定性； 2、负责业务领域核心数据体系的规划设计。在数据技术上，能结合业界技术探索数据服务的增量。在数据化运营和数据能力产品化上，制定数据技术和服务的策略。包括用户标签体系、数据智能化和自动化体系和实时数据体系的建设； 3、规划设计数据服务工具，提升数据研发的工作效率，搭建数据服务的工具/产品，赋能业务同学和业务产品，灵活支撑业务的创新和探索，让数据价值更浸透； 4、负责数据质量、稳定性等数据管理，数据内部共享融通的数据平台，让数据标准更规范、数据获取更高效。

更新于 2025-09-23杭州

推荐架构工程师/专家 - 【主APP研发效率/稳定性方向】

社招D6326

1、设计与搭建快手百亿流量的个性化推荐系统，参与推荐系统架构迭代演进； 2、针对互联网大规模协作、快速迭代的场景，建设研发效率工具和平台，保障和提升研发效率； 3、通过流程机制建设、低代码、平台化等方式，持续提升推荐系统稳定性。

更新于 2025-04-03北京

测试开发专家工程师(稳定性方向)(JR2026010700S)

社招5年以上技术

1. 稳定性体系规划与落地（质量侧）：负责业务线整体生产安全与稳定性保障体系的建设。作为质量侧代表，与 SRE、业务研发团队紧密协同，制定并落地高可用架构标准。从业务视角出发，定义稳定性衡量标准（SLA/SLO），并推动技术团队达成稳定性指标（如降低故障率、缩短 MTTR）。 2. 红蓝对抗与全链路演练(质量侧)：主导或参与常态化的红蓝对抗演练。负责设计高复杂度的业务故障场景（蓝军视角/导演视角），验证系统的容灾能力和团队的应急响应能力。协同 SRE 建设故障注入平台，推动“以演代战”，确保应急预案的有效性和自动化执行率。 3. 变更风险管控：建立严格的变更管控机制（发布红线、灰度策略、回滚机制）。建设“变更防御”能力，利用自动化手段拦截高风险代码和配置进入生产环境，治理因变更导致的稳定性问题。 4. 线上巡检与业务核对（BCP）：建设分钟级的业务一致性核对系统，确保在系统未报错但业务逻辑异常（如资金损失、数据不一致）时能快速发现。补齐监控盲区：不仅关注系统监控（CPU/内存等），更要补齐业务监控盲区。

更新于 2026-01-13