logo of thead

平头哥平头哥-存储芯片固件专家/高级专家-杭州&成都&上海

社招全职5年以上技术-芯片地点:成都 | 杭州 | 上海状态:招聘

任职要求


1、具备文件系统,SSD、存储管理、上下电、RAID方面的专业知识
2、具有有存储软件/固件开发/产品化经验
3、高水平的C/C++开发经验
4、熟悉ARM的编程架构

工作职责


1、负责和参与存储芯片FW的开发;
2、参与芯片的软硬件架构设计
3、完成FW的调试和验证
4、基于黑盒和灰盒完成FW相关功能测试
包括英文材料
C+
C+++
相关职位

logo of cxmt
社招3年以上信息技术类

1. 智能存储架构设计 主导混合云环境下的SAN/NAS融合架构设计,制定跨品牌存储资源池化方案 设计基于AI的FC SAN网络动态路径优化系统,实现Brocade 720级交换网络智能负载均衡,端到端延迟波动≤0.5ms 2. 生产级存储SLA保障 构建存储健康度数字系统,通过实时IO热力图分析实现存储性能瓶颈提前72小时预警(检测准确率≥98%) 主导多厂商存储固件升级制定零停机滚动升级方案,确保关键业务可用性≥99.999% 3. 灾备韧性体系建设 设计跨地域存储双活(HyperMetro+SRDF同步复制)与CDP持续数据保护混合方案,达成核心系统RPO=0且RTO≤180秒的军工级可靠性标准 建立灾备剧本库,通过模拟全链路故障,验证TB级Oracle RAC集群分钟级恢复能力

更新于 2025-09-19
logo of thead
社招8年以上技术-芯片

1.了解存储应用,分析行业趋势,同时了解内部业务部门的存储需求,从而开发针对阿里巴巴数据中心应用的高度定制和优化的存储硬件和软件。 2. 编写SoC架构规范,作为工程和执行的参考。 3. 开发详细的微体系结构,包括定义硬件分区以及控制和数据流。 4. 与跨职能团队合作测试和验证自行开发的存储产品,以实现大批量生产。 5. 参与并导引整个SoC开发生命周期,涵盖概念,功能定义,实现,FPGA原型设计和测试,文档,交付和维护。 6. 发表相关技术论文,申请专利并与行业合作伙伴合作以推动存储硬件/软件标准化。 7. 为阿里巴巴自研开发的存储硬件和软件定义路线图

更新于 2025-09-16
logo of thead
社招5年以上技术-芯片

1. 负责下一代服务器/板卡/SoC固件自主研发及产品交付和维护; 2.负责OpenBMC 相关模块的功能开发和定制化需求; 3.负责解决项目中BMC领域相关的问题; 4.负责和芯片、硬件、BIOS等研发人员沟通相关接口验证及功能开发设计方案; 5.负责项目开发过程中相关文档的编写和输出; 6. 引领BMC领域技术发展趋势,结合平头哥业务应用场景,开拓芯片/OpenBMC技术发展方向,并推动相关技术产品化落地。

更新于 2025-08-04
logo of thead
社招5年以上技术-芯片

我们正在寻找一位熟悉数据中心建设、服务器部署与高性能网络运维的优秀工程师,加入我们致力于构建*下一代AI算力基础设施的核心团队。 你将参与企业级GPU集群的规划、部署与持续优化,支撑大语言模型(LLM)千亿级参数训练任务的稳定运行。如果你热爱“硬核”系统工程,关注物理层到网络层的极致性能,并希望在AI时代打造真正的“算力底座”,欢迎加入! 你将负责: 1. AI数据中心规划与机房部署 参与新建或改造AI专用机房,完成服务器上架、电源配比、散热方案评估、PDU/UPS/BMC等基础设施配置,确保高密度GPU集群的可靠运行。 2. 大规模GPU集群部署与维护 主导NVIDIA A100/H100等高端GPU服务器的初始化、固件升级、驱动安装与健康监控;建立标准化部署流程(自动化装机、配置管理),提升交付效率。 3. 高性能网络架构支持(RDMA/InfiniBand/RoCE) 配合网络团队完成IB/RoCE网络部署,配置子网管理器(SM)、交换机(如 Mellanox/NVIDIA Quantum-2)、路由策略;保障低延迟、高带宽通信满足AllReduce需求。 4. NCCL通信性能调优与故障排查 协助算法团队分析分布式训练中的通信瓶颈,结合nccl-tests、ibstat、ethtool等工具进行链路诊断;优化GPU拓扑(NVLink/NVSwitch)、NUMA绑定、MTU设置等关键参数。 5. 基础设施监控与自动化运维 搭建硬件健康监控体系(温度、功耗、风扇、ECC错误等),集成Prometheus + Grafana + Alertmanager;编写脚本实现自动巡检、告警响应与故障定位。 6. 跨团队协作支持训练平台稳定运行 与开发、QA团队协同,为大模型训练提供稳定、高效的底层算力环境,快速响应宕机、链路中断、丢包等紧急问题。

更新于 2025-10-09