阿里云阿里云智能-服务器结构系统高级技术专家-深圳/杭州
任职要求
1、至少8年服务器结构设计工作经验,主导过液冷整机柜设计,熟悉快速原型开发(如3D打印)技术,熟悉金属/复合材料特性及轻量化设计; 2、有过液冷冷板整机柜设计经验,熟悉和了解国内外冷板前沿技术趋势、熟悉冷板国内外生态; 3、精通机械设计软件(SolidWorks/Creo/AutoCAD等)及仿真工具(ANSYS、FloTHERM等); 4、…
工作职责
1. 负责服务器整机和液冷整机柜产品的系统设计、开发、交付; 2. 根据项目需求,进行服务器结构方案的制定和技术评估,提供可行性分析报告,为项目决策提供技术支持; 3. 与服务器ODM厂家紧密合作,负责服务器整机规格制定、负责整机设计过程质量管控,整机测试,整机交付质量管控; 4. 负责服务器结构相关的技术文档编写和维护,包括设计文档、测试报告、用户手册等; 5. 负责服务器产品的测试和验证工作,以及过程管理,解决测试过程中出现的结构问题,确保产品质量; 6. 跟踪行业新技术动态,研究新技术在服务器结构设计中的应用,不断提升产品竞争力; 7. 为公司其他部门提供服务器结构方面的技术支持和培训,协助解决相关技术问题。
1.负责服务器GPU超节点软件系统方案,主导互连软件的架构设计、研发交付、应用优化(训练及推理场景下SHMEM技术,KV Cache,共享内存,互连传输软件)等, 参与模块实现,问题攻关; 2.参与下一代数据中心服务器超节点定义、如数据面软硬件协同方案; 3. 参与行业领先的互连标准定义,以及行业生态的推动及落地; 4. 参与创新研究,发表相关技术论文,申请专利。
1. 主导储能行业技术/供应趋势/竞品洞察/演进方向分析;输出竞争力的技术路标和方案并通过预研实现方案量产落地,提升产品的市场竞争力; 2. 负责储能产品开发方案可制造性的分析/评审/论证(系统拓扑图、原理图、layout、元器件选型),确保试产/量产快速通过; 3. 负责储能生产测试需求/方案/策略/计划制定与评审,测试规范/用例/环境的建设和优化以及技术平台维护(规范/经验案例/专利),保证系统方案最优; 4. 主导储能生产测试重大异常分析/定位/验证/闭环,含设计/工艺/装备/来料问题;协助搭建生产测试平台进行电气性能/元器件应力/EMC/环境/安规可靠性测试; 5. 主导关键生产测试装备体系化&集成化的开发和导入,确保生产测试装备软硬件竞争力指标落地; 6. 对产品量产交付负责,通过管理/协调团队达成产品从0→1以及从1→100的关键指标; 7. 承担电源制造专家培养和流程建设责任,支撑部门人才梯队建设和组织建设目标达成。
负责阿里集团、阿里云战略级产品SLS研发,在日增数百PB级的超大规模实时数据之上,挑战从“经典可观测性”向“AI Native 基建”的跨越。通过实时采集、索引、存储、语义检索和分析等技术,实时处理每日数百PB海量数据,并针对AI应用场景进行特定优化,提供智能、自动化数据检索和分析服务。加入该岗位,您将有机会在国内超大规模的实时日志平台上,打造新一代的AI基础设施。 1.定义下一代 AI 数据基座: 基于现有海量日志平台,重构面向 Agent Runtime 的数据基础设施,解决高吞吐写入与低延迟语义检索共存的工程难题; 2.构建 Data + AI 飞轮: 研发高性能的数据清洗与向量化流水线,从数据中实时化萃取高质量数据,构建AI存储和检索系统,通过构建数据反馈回路,使模型和Agent持续进化; 3.超大规模系统攻坚: 维护并演进日处理百 PB 级数据的实时平台,在极致的成本与性能约束下,探索存算分离、混合索引等前沿技术落地。