长鑫存储核心存储阵列新产品项目负责人| New Product Array PEL(J16912)
任职要求
1、硕士以上学历,电子科学与技术、微电子、集成电路、半导体、理工科系专业背景尤佳;
2、具备良好的汇报能力、半导体工程问题解决思维,具备半导体产品开发、测试、设计或工艺相关经验,任一满足即可;
3、从事存储相关领域并负责产品开发5年以上或从事IC设计,半导体产品与测试等相关行业工作8年以上;
4、参与完整的产品研发项目3项以上;
5、优秀的沟通能力与项目管理能力,积极进取,执行力强.;
工作职责
DRAM新产品存的PTE产品跨部门项目负责人(核心存储阵列方向) ,负责统筹新产品从产品验证到产品量产导入,包括设计验证,测试流程优化,良率提升。 (1)制定新产品的整体新产品导入策略、测试计划、管理项目时程,确保项目准时达交; (2)负责协调PTE内外功能部门进行产品功能性验证确保效率资源最大化并统筹工艺或设计问题,确保问题最终获得解决;
岗位使命: 作为长鑫存储技术战略的核心践行者,您将主导高密度DRAM技术平台的颠覆性创新,驱动半导体产业变革,以尖端工艺整合能力重塑存储技术的研发范式 核心价值贡献: 1.战略解码与技术定义: -参与存储技术路线图规划,联动市场部与设计部进行需求-技术双轮驱动,将终端应用场景转化为DRAM器件的关键性能指标(如速度、功耗、密度),主导工艺规格的顶层设计,确保技术路径与商业战略高度契合 2.制程整合创新: -协同光刻、刻蚀、薄膜、CMP等工艺团队,制定整合方案,解决跨模块技术难点,确保工艺流程的稳定性 3.跨域协同创新: -领衔“四位一体”技术攻坚体系(设计/器件/工艺/检测),构建从纳米级器件物理模型到晶圆级制造的系统化平台,突破存储单元微缩化极限、阵列电容性能优化等核心挑战,实现电性参数-工艺参数-缺陷控制的全局最优解 4.技术生态构建: -打造业界领先的工艺整合技术中台,集成FMEA失效预判矩阵、SPC量产稳健性评估模型及机器学习驱动的缺陷根因溯源自愈系统,贯穿新产品平台研发全周期(需求定义→工艺开发→良率爬坡→量产导入),重塑存储技术量产范式
岗位使命: 作为长鑫存储技术战略的核心践行者,您将主导高密度DRAM技术平台的颠覆性创新,驱动半导体产业变革,以尖端工艺整合能力重塑存储技术的研发范式 核心价值贡献: 1.战略解码与技术定义: -参与存储技术路线图规划,联动市场部与设计部进行需求-技术双轮驱动,将终端应用场景转化为DRAM器件的关键性能指标(如速度、功耗、密度),主导工艺规格的顶层设计,确保技术路径与商业战略高度契合 2.制程整合创新: -协同光刻、刻蚀、薄膜、CMP等工艺团队,制定整合方案,解决跨模块技术难点,确保工艺流程的稳定性 3.跨域协同创新: -领衔“四位一体”技术攻坚体系(设计/器件/工艺/检测),构建从纳米级器件物理模型到晶圆级制造的系统化平台,突破存储单元微缩化极限、阵列电容性能优化等核心挑战,实现电性参数-工艺参数-缺陷控制的全局最优解 4.技术生态构建: -打造业界领先的工艺整合技术中台,集成FMEA失效预判矩阵、SPC量产稳健性评估模型及机器学习驱动的缺陷根因溯源自愈系统,贯穿新产品平台研发全周期(需求定义→工艺开发→良率爬坡→量产导入),重塑存储技术量产范式
职责: 1、设计与存储单元阵列相关的核心电路,并开发DRAM通用IP。 2、评估并优化高性能DDR和LPDDR的内存架构。 3、模拟、验证和分析电路功能和性能。 4、协助建立设计流程和质保流程。 5、监督布局和验证过程,包括布局规划、布局和布线;并指导布局工程师进行布局开发。 6、为产品工程部门提供硅调试方面的支持。
我们正在寻找一位熟悉数据中心建设、服务器部署与高性能网络运维的优秀工程师,加入我们致力于构建*下一代AI算力基础设施的核心团队。 你将参与企业级GPU集群的规划、部署与持续优化,支撑大语言模型(LLM)千亿级参数训练任务的稳定运行。如果你热爱“硬核”系统工程,关注物理层到网络层的极致性能,并希望在AI时代打造真正的“算力底座”,欢迎加入! 你将负责: 1. AI数据中心规划与机房部署 参与新建或改造AI专用机房,完成服务器上架、电源配比、散热方案评估、PDU/UPS/BMC等基础设施配置,确保高密度GPU集群的可靠运行。 2. 大规模GPU集群部署与维护 主导NVIDIA A100/H100等高端GPU服务器的初始化、固件升级、驱动安装与健康监控;建立标准化部署流程(自动化装机、配置管理),提升交付效率。 3. 高性能网络架构支持(RDMA/InfiniBand/RoCE) 配合网络团队完成IB/RoCE网络部署,配置子网管理器(SM)、交换机(如 Mellanox/NVIDIA Quantum-2)、路由策略;保障低延迟、高带宽通信满足AllReduce需求。 4. NCCL通信性能调优与故障排查 协助算法团队分析分布式训练中的通信瓶颈,结合nccl-tests、ibstat、ethtool等工具进行链路诊断;优化GPU拓扑(NVLink/NVSwitch)、NUMA绑定、MTU设置等关键参数。 5. 基础设施监控与自动化运维 搭建硬件健康监控体系(温度、功耗、风扇、ECC错误等),集成Prometheus + Grafana + Alertmanager;编写脚本实现自动巡检、告警响应与故障定位。 6. 跨团队协作支持训练平台稳定运行 与开发、QA团队协同,为大模型训练提供稳定、高效的底层算力环境,快速响应宕机、链路中断、丢包等紧急问题。