长鑫存储系统运维工程师 | System Operations Engineer(J17623)
任职要求
1.计算机相关专业本科及以上学历,5年以上生产环境运维经验,精通Linux/Windows系统管理,熟悉企业级存储解决方案(NetApp/EMC/华为) 2.具备自动化运维能力和脚本开发经验 3.操作系统:R…
工作职责
1. 系统运维与管理 (1)负责Linux(CentOS/RHEL/Ubuntu)和Windows Server(2019/2022)系统的全生命周期管理 (2)管理企业级存储系统(NAS/SAN),包括容量规划、性能优化和数据保护 (3)协助维护Active Directory域环境及相关核心服务(DNS/DHCP/Group Policy) (4)部署和管理虚拟化平台(VMware/Hyper-V/KVM),优化资源利用率 2. 自动化运维 (1)开发Shell/Python/PowerShell自动化脚本,提升运维效率 (2)使用Ansible/Puppet或MDT/WDS等工具实现标准化部署 (3)建立自动化监控告警机制,实现故障自愈 3. 监控与应急响应 (1)部署和维护Zabbix监控系统,建立完善的监控指标体系 (2)制定并执行7×24小时应急响应预案 (3)主导重大故障的排查和恢复,确保SLA达标 4. 数据保护管理 (1)设计并实施多层次数据备份策略(全量/增量/差异备份) (2)定期组织灾难恢复演练,优化RTO和RPO指标 (3)建立存储健康度评估体系,实现"亚健康"预警
1. 制定系统PM计划并进行人力安排, 及时解决系统运行问题; 2. 对于系统层面的问题及时编制技术解决方案,并指导相应的工程团队实施,进行功能验收及质量验收,严格执行相关法律法规; 3. 系统施工厂商管理,包含厂商人员考核,人员出工,工作分派,安全管理,成果验收等; 4. 系统施工程序管理,包含工具箱会议,任务分派,施工申请,文件整理,付款作业等; 5. 系统设施设备,环境卫生的定期检查,维护管理。
1. MES系统需求讨论,分析与确认,参与MES相关需求讨论,理解MES需求目的,对需求提出可解决的方案或建议; 2. MES系统设计,开发和测试,根据需求和设计文档进行开发任务,开发完成后提出测试案例,编写测试文档,参与系统功能设计; 3. MES系统问题和改善,完成系统问题Bug修复,对系统的新需求进行功能改善; 4. MES 功能培训,负责MES新功能的Operation Traning; 5. MES系统 3 rd Line 支援 ,协助Operation Team调查解决产线MES系统异常问题。
1. 主要负责MES的内部运维工作,负责公司内部和第三方软件的配置,开发,维护和支持工作; 2. 全程参与软件的生命周期管理,包括撰写和分析用户的需求,研究,设计,归档,编码,支持; 3. 需要在业务需求和基础开发之间转换,合并并提供最佳的解决方案; 4. 需要编写高质量软件和参与软件功能改进工作,需要提供创建业务价值的解决方案,同时最小化减少软件缺陷,停机或性能下降带来的负面影响; 5. 分析业务需求和了解问题 ,分析软件方案 ,遵循软件开发生命周期交付解决方案,实施第三方系统 ,提供软件的24*7运维支持; 6. 协助团队达成相关KPI指标 。
1. ASE设备的监控和运维 (硅片盒/硅片盒检测机/硅片分片机/硅片储存机/硅片盒清洗机/光罩盒清洗机/硅片盒氮气充填系统); a) 了解及掌握各硬件的运营模式; b) 确认相关各系统软硬件各项监控措施、运维设施工具和工作环境; c) 监控各设备运营状态,及时处理各设备异常; d) 收集及反馈设备异常情况,协助工程师处理和改善相关异常; e) 接受部门培训与SOP学习,提升现场异常对应能力; 2. AMHS系统和设备的监控和运维(自动物料搬送系统); a) 了解及掌握各系统的运营模式 ; b) 监控系统软硬件的运行状态,及时处理异常情况; c) 接受部门培训与SOP学习,提升现场异常对应能力; d) 第一时间与供应商配合处理AMHS系统运行过程中产生的异常情况,确保生产的顺利进行。 3. 日常部门工作; a) 工作交办、进度跟进,协助工程师处理异常问题。 b) 本部门内各系统日常Monitor及故障对应; c) 本部门内各设备日常Monitor及故障对应; d) Fab内关于本部门负责设备(运营)及场所(环境/安全)日常检查; e) 定期工作报告产出; f) 上级主管交办事务处理; 4. 配合外部需求部门; a) 现场协助生产针对异常进行一线处理; b) 协助厂务/环安等部门处理FAB内相关异常状况; c) 6S问题发现及改善; d) 协助供应商在Fab内的问题解决和跟进;