logo of aliyun

阿里云阿里云智能-服务器软硬件结合高级开发工程师-深圳/杭州

社招全职3年以上云智能集团地点:深圳 | 杭州状态:招聘

任职要求


1、3年及以上服务器相关软硬件结合系统软件开发经验,具有丰富的软硬件结合系统软件的开发和性能优化经验;具有操作系统、计算/存储/网络/AI解决方案/AI软硬件结合相关开发或者优化应用经验。
2、主导过多个项目及多个子系统的特性设计、需求分析经验, 能够独立的进行模块、子系统方案设计和开发验证交付。
3、深入掌握行业与竞对新信息,包括行业前沿技术发展趋势、竞对和对标产品优劣势,能结合业务预判规划领域未来竞争力。
4、具备较强的技术分析和学习能力,能对软硬件结合问题进行定位和解决。

工作职责


1、服务器软硬件一体系统设计与开发:基于产品需求分析,进行整体技术方案设计、开发和验证交付。
2、系统性能优化:对服务器进行软硬件一体性能优化和分析,实现软件系统稳定性/性能的提升。
3、系统测试与维护:对软硬件系统进行集成验证交付,对系统性问题进行分析定位,快速解决,保证满足系统性能、稳定性等要求。
包括英文材料
相关职位

logo of aliyun
社招3年以上云智能集团

1. 基于对主流AI芯片和服务器架构的深刻理解,分析硬件加速特征与内部拓扑结构,提供硬件优化实践和调优指南,确保充分发挥硬件潜能。 2. 结合主流LLM推理框架 (如sglang/vLLM) 和大模型结构及其计算特性,通过软硬件协同优化和技术创新 (包括但不限于硬件算子优化、显存以及并行化等),负责新服务器上的端到端性能分析和优化。 3. 提供场景化的定制优化能力,识别并解决大模型在不同业务场景下的性能瓶颈,快速的给出满足需求的性能优化方案。 4. 熟悉系统调优和Profiling工具 (如 nsys/ncu系列、通用工具如Perf、火焰图等),负责系统级性能分析与瓶颈定位能力,并能基于硬件特性进行软件适配与优化。 5. 洞悉大模型的发展趋势和技术演进,结合硬件Profling和Trace 数据,为下一代AI基础设施的服务器设计与研发提供量化数据分析支持。

更新于 2025-09-24
logo of aliyun
社招3年以上云智能集团

1. 负责研发针对AI 硬件的性能画像模型,跟踪业界模型的发展和框架的发展,结合阿里云AI服务器提供场景化的性能预估和优化策略推荐。 2. 负责提供场景化的定制分析能力,分析大模型在不同服务器下的性能差异,快速的给出满足业务的性能优化配置策略,加速业务的部署。 3. 负责调优和Profiling工具的分析和应用,跟踪和分析硬件性能优化技术,快速的使能新AI服务器。 4. 与硬件设计和规划人员协同,结合历史性能数据,提炼性能影响的关键硬件特征和需求,为下一代AI基础设施的服务器设计提供输入。

更新于 2025-08-08
logo of aliyun
社招3年以上云智能集团

1. 负责FPGA/芯片产品的架构和系统方案设计,定义软硬件接口和FPGA逻辑架构, 完成逻辑设计和开发、测试、上线、运维等全生命周期的研发工作; 2. 负责相关FPGA/芯片的性能优化和稳定性保障,持续提升多媒体处理硬件方案的性能和稳定性,确保系统安全、稳定、高效运行; 3. 参与多媒体处理等新技术预研和规划,跟踪业务需求和行业技术变化,进行产品规划和FPGA架构演进;包括图像视频生成软硬结合加速技术,推理框架硬件并行加速技术,图像视频编解码硬件加速技术,其它图像处理硬件加速技术等。

更新于 2025-09-08
logo of aliyun
社招3年以上云智能集团

阿里云持续推进AI与云计算深度融合的战略布局,聚焦AI基础设施、大模型平台及企业级AI应用等核心场景。为加速专有云网络产品的技术演进,现诚邀优秀人才加入: ● 负责专有云云计算网络产品的设计与研发,围绕虚拟化、负载均衡(四层/七层)、容器网络、服务网格及软硬件协同等云网络与云原生关键技术,开展技术分析、方案选型与功能设计工作。 ● 承担云网络核心模块的编码实现,包括网元、网关等产品的功能开发、单元测试(UT)、端到端测试(E2E)用例编写、代码调试与评审,以及版本发布等全流程研发任务。 ● 参与专有云网络运维体系建设,负责线上问题的定位、分析与解决,为一线技术支持团队提供技术支撑,保障产品稳定高效运行。 ● 具备大模型应用开发能力,结合实际运维场景,推动运维系统的智能化升级,提升运维体系的可靠性、自动化水平与用户体验。

更新于 2025-09-05