阿里云阿里云智能-服务器运营平台研发专家-杭州
社招全职5年以上技术类-开发地点:杭州状态:招聘
任职要求
1. 5年以上IT、互联网、云计算开发相关工作经验,有2年及以上基础设施运维相关产品的开发经验。 2. 精通JAVA开发,熟悉JAVA的主流架构,包括spring、netty、mybatis等。熟悉大数据相关技术,有Flink/Spark等开发经验。 3. 熟悉服务器硬件领域,熟悉X86/ARM CPU架构,熟悉服务器部件如内存、硬盘等,熟悉服务器内部接口标准和外部访问协议标准,了解GPU/AI芯片等应用场景。 4. 在AI服务器硬件,固件,系统软件等方面有开发经验和专业级的认识优先。
工作职责
数据中心运营平台团队的使命是实现服务器、IDC等基础设施整个运营领域的全面产品化支撑,从而达到高效率,低成本,低功耗的智能运维。集成了服务器和IDC领域的各项专业技术,以及运维平台进一步的智能化支持,我们立志打造一个真正自动驾驶的数据中心。 作为服务器领域开发专家,您将负责: 1. 负责服务器采集监控机制的定义与优化,包括定义采集的数据,频率以及后续业务应用方式。 2. 负责服务器性能、功耗等数据的分析与应用,提取业务特征,分析业务瓶颈并优化。 3. 基于ARM/X86架构,以及各类AI等异构架构的场景,完善监控与运维手段。 4. 基于故障宕机等场景,从集群角度增强服务器容灾与带故障运行的能力,可用性与稳定性。 5. 基于服务器领域知识与智能化相结合,运用智能化手段管理服务器。 6. 支撑单元化等特殊服务器集群管理场景。
包括英文材料
Java+
https://www.youtube.com/watch?v=eIrMbAQSU34
Master Java – a must-have language for software development, Android apps, and more! ☕️ This beginner-friendly course takes you from basics to real coding skills.
Spring+
https://liaoxuefeng.com/books/java/spring/index.html
Spring是一个支持快速开发Java EE应用程序的框架。它提供了一系列底层容器和基础设施,并可以和大量常用的开源框架无缝集成,可以说是开发Java EE应用程序的必备。
https://spring.io/guides/gs/rest-service
https://spring.io/quickstart
Level up your Java code and explore what Spring can do for you.
MyBatis+
https://mybatis.org/mybatis-3/getting-started.html
https://www.baeldung.com/mybatis
MyBatis is an open source persistence framework which simplifies the implementation of database access in Java applications.
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
Flink+
https://nightlies.apache.org/flink/flink-docs-release-2.0/docs/learn-flink/overview/
This training presents an introduction to Apache Flink that includes just enough to get you started writing scalable streaming ETL, analytics, and event-driven applications, while leaving out a lot of (ultimately important) details.
https://www.youtube.com/watch?v=WajYe9iA2Uk&list=PLa7VYi0yPIH2GTo3vRtX8w9tgNTTyYSux
Today’s businesses are increasingly software-defined, and their business processes are being automated. Whether it’s orders and shipments, or downloads and clicks, business events can always be streamed. Flink can be used to manipulate, process, and react to these streaming events as they occur.
Spark+
[英文] Learning Spark Book
https://pages.databricks.com/rs/094-YMS-629/images/LearningSpark2.0.pdf
This new edition has been updated to reflect Apache Spark’s evolution through Spark 2.x and Spark 3.0, including its expanded ecosystem of built-in and external data sources, machine learning, and streaming technologies with which Spark is tightly integrated.
相关职位
社招2年以上云智能集团
1. 负责AI产品服务端能力设计与开发,保障技术实现满足产品规划和用户需求; 2. 负责站点部署实施,包括前后端部署架构设计、网站内容管理、后端核心模块实现等; 3. 负责2C产品能力建设,包括运营平台建设、用户运营能力实现等; 4. 持续优化和提升在线服务稳定性,保障用户体验。
更新于 2025-10-13
社招3年以上云智能集团
1、负责Aliyun.com业务运营的研发支撑工作,构建适合业务快速迭代的平台能力; 2、对业务场景保持敏锐,快速熟悉业务流程并理解业务痛点,对产品需求进行沟通、分析,完成技术方案的制定,核心系统及模块的设计与研发,驱动产品快速迭代; 3、参与建设通用、灵活、智能的业务支撑平台,支撑上层多场景的复杂业务,参与制定系统架构演进; 4、独立完成中小型项目的落地及管理工作,确保项目进度和质量,团队内外的沟通协作,包括业务沟通,技术合作,项目及人员管理等,推动组织高效运作; 5、能够在团队中完成code review的任务,确保相关代码的有效性和正确性,并能够通过code review提供相关编码、性能以及稳定性的建议。
更新于 2025-09-08
社招5年以上智能与信息技术
1. 基于公司数据计算平台,构建企业级安全威胁检测中枢平台,实现实时流量分析与离线威胁建模双引擎; 2. 未知威胁规则建设和运营提升,主导APT检测规则建设开发,设计基于ATT&CK框架、基于公司安全事件场景、行为基线的检测规则; 3. 构建自动化威胁分析流水线,集成EDR日志、网络流量元数据、身份认证信息等多源数据(日均PB级处理) 4. 检测规则运营体系搭建,建立威胁狩猎闭环流程,支撑提高平均检测时间和处置时间; 5. 集成多家威胁情报供应商服务,建设公司私有威胁情报服务,提供云查杀与沙箱服务等; 6. 与红队合作开展ATT&CK攻击模拟,持续优化检测策略有效性;