长鑫存储研发智能数据科学(J17355)
任职要求
学历要求:硕士及以上,博士优先 专业要求:计算机、数学、软件工程、物理等理工科专业 其他要求: 1.通过CET-6或同等外语水平,具备良好的英文听说读写能力 2.学习能力与实践能力强,具备数据科学前沿领域文献阅读与快速代码实践能力 3.拥有良好的沟通协调能力,在校期…
工作职责
1.负责研发工程分析系统的设计、数据处理、算法与功能开发,用数据科学的方法与工具,提高研发效率和缩短新产品研发周期 2.负责与设计/器件/工艺/整合/可靠性/缺陷与量测/IT等相关部门合作,进行工程数据分析系统的项目管理,完成需求梳理,产品设计与规划,推动系统开发与落地,产生业务价值 3.负责针对特定研发领域工程问题,进行数学建模,优化求解,统计建模,数据挖掘,数据分析,解决实际问题。然后进一步抽象出方法论,通过系统化,高效解决类似问题,加速研发 4.负责进行半导体图像数据处理,使用OpenCV等传统视觉工具,快速提取针对特定问题特征,实现高信噪比指标来表征工程问题,加速研发 5.负责探索和落地应用前沿的AI模型与算法,包括深度学习、机器学习方面,提升半导体制造领域的图像分类、检测与分割等方面的系统性能,提升工程分析效率与能力 6.负责探索和落地应用前沿的AI方法,提升时间序列数据的异常检测,异常诊断等系统性能,提升工程分析效率与能力
1.引入先进的AI技术和算法,与团队探索工艺研发,工艺优化中数字化,智能化的场景,将工艺研发与AI技术深度融合,创新工艺配方的研发及优化流程,与业务团队紧密合作,显著提升研发效率并缩短研发周期 2.探索DRAM测试验证中数字化,智能化的场景,包括但不限于:修补,ECC,测试pattern优化,根因分析等方向,与测试团队紧密合作,提升测试验证效率和准确度,缩短整体测试时间 3.与设计部门紧密合作,研究电路设计中数字化、智能化方案,包括但不限于电路仿真,数字验证,设计优化,版图生成,物理验证等方向,提升设计流程效率,加速产品设计进程,增强设计验证的全面性和可靠性 4.与模型团队协同,推进多模态大模型的开发和训练,加速大模型在长鑫的业务落地及应用
AI测试系统开发: -基于大模型技术构建智能测试平台,实现测试用例自动化生成、测试结果实时分析及缺陷预测,提升测试覆盖率至99%以上。 -开发AI驱动的动态测试策略优化引擎,缩短测试周期30%-50%,降低冗余测试用例比例。 2.测试数据分析与溯源: -构建多维度测试数据湖,利用深度学习挖掘测试数据中的潜在失效模式,实现缺陷根因的秒级定位。 -设计测试约束左移方案,在早期设计阶段介入风险识别,减少后期迭代成本。 3.测试流程智能化重构: -主导AI与传统测试工具(如LabVIEW、Jenkins)的深度融合,推动自动化测试向自主决策测试演进。 -研发自适应测试框架,支持复杂场景(如高低温、电压瞬变)下的智能参数调优与异常捕获。 4.跨领域协同创新: -联动设计、制造及可靠性团队,建立测试-设计反馈闭环,驱动产品设计规则优化。 -沉淀AI测试知识图谱,形成可复用的测试模式库与最佳实践指南。
1.主导技术研发与优化: 设计并实施统计推断、实验设计(DOE)、机器学习、深度学习及大语言模型(LLM)算法,包括预训练模型调优和指令微调等核心技术,以抽象和解决半导体业务中的核心数学问题(如良率提升、性能优化、可靠性增强) 开发自动化方案(使用Python、R等工具进行原型开发),实现数据分析、模型训练和预测的自动化,支持设计验证、制造和测试环节的高效决策 2.赋能业务与效率提升: 对接业务需求,构建定制化AI/ML解决方案(如大语言模型应用),挖掘多源异构数据,全面提升数据整合、基础设施和计算能力,以驱动研发效率、良率和质量改进 研发智能化工具和系统(例如数据分析平台或模型部署框架),协助各部门实现数据驱动的优化,缩短研发周期并降低成本 3.洞察前沿与技术转化: 密切关注AI和半导体领域的最新动态(如大模型进展),将前沿技术转化为实际应用,推动公司技术边界的持续拓展 确保技术方案与半导体设计研发、生产制造和封装测试流程紧密结合,实现端到端的效率提升
1. 数据采集与质量管控: - 设计并实施面向具身机器人的多模态数据采集方案,覆盖 传感器数据(摄像头、激光雷达、关节数据)、交互行为数据及环境语义信息。 - 制定 数据质量评估体系(如标注准确率、场景覆盖率、分布均衡性),通过自动化校验(规则引擎、异常检测)和人工抽样审核保障数据有效性。 - 与算法团队深度协作,将模型需求(如长尾场景挖掘、多模态对齐)转化为可执行的采集策略(如场景布置、合成数据生成)。 2. 数据链路开发与优化:构建高效的数据流水线,支持大规模数据存储、传输和实时处理。 3. 数据标注与增强:与标注团队合作,制定数据标注规范,确保标注一致性。 4. 支持算法研发:为具身智能算法团队提供高质量数据集,支持强化学习、模仿学习、感知与控制等方向的研究。 5. 跨团队协作:与硬件团队、软件团队及算法团队紧密合作,确保数据流与系统架构无缝集成。