百度昆仑芯-芯片中后端/硬件系统研发实习生(J83516)
任职要求
-微电子、计算机、通信、自动化专业硕士及以上学历
-熟悉DFT原理和方法;了解静态时序分析以及仿真基础知识…工作职责
DFT方向: -负责block芯片中的DFT相关设计工作,包括MBIST,Scan,Boundary Scan等等 -提高测试覆盖率,产生测试向量并进行仿真,解决前后仿中遇到的问题 -协助其他团队完成芯片设计中DFT相关的Timing/Power-IR分析和收敛 硅后验证方向: -在芯片设计阶段,从系统应用和调试角度参与芯片定义 -结合业界标准规范和实际应用场景制定全面详细的validation plan -在post silicon阶段,负责芯片的bring-up和validation,分析并解决发现的问题 -与软硬件团队合作,基于主流AI模型,进行系统性能和功耗以及稳定性的分析与优化
1. 针对整机柜服务器产品进行全面的计算、互联、监控等能力的全面赋能和开发; 2. 寻找适合于整机柜异构服务器产品的业务产品并进行对应的昆仑组件设计和开发,包含性能评测分析、容器镜像等 3. 针对整机柜硬件架构及业务落地场景,构建故障异常case并能设计故障诊断方案; 4. 负责跟踪及研究主流GPU架构设计技术,参与下一代AI Infra的设计; 5. 根据业务画像,构建有竞争力的异构硬件和系统全链路的量化分析,形成数据决策数据库;有效推动异构服务器产品的规划和落地。
● 设计和实现高效的训练推理框架,提升多节点、多GPU环境下特别是异构算力场景下的计算效率。具备良好的工程实践和算法理论基础,熟悉底层的硬件编程和常见GPU的算子库开发,能对算法的运行效率如速度、显存占用等进行优化,推动算法稳定、高效的运行。 ● 完善优化训练推理框架,针对市面上的国产信创卡能提出统一的优化方案,并推进在底层的通信效率、资源占用、稳定性方面持续建设。 ● 设计并实现能够处理大规模并发请求的系统架构,确保极端负载下的稳定性和性能。完善错误自愈机制,提升平台训练的MFU,打造行业内一流的异构算力混训混推GPU框架。 ● 技术方案设计:主导核心模块技术方案设计与评审,结合业务需求与系统现状,制定可落地的架构规划。 ● 基础服务开发:构建高可用、可扩展的基础服务组件,支持训练/推理框架的快速迭代与稳定部署。 ● 项目管理:主导跨团队协作项目的全生命周期管理,包括需求拆解、排期规划、进度跟踪与风险控制,确保项目高效交付。 ● 持续关注并跟进业界技术发展,比如超长上下文、端到端推理思维链、多模态等方向。
-负责从芯片、封装到板级、整机的散热设计和仿真分析; 主导昆仑芯AI芯片的散热设计及后续测试、样机制作、优化、转产等;主导输出散热设计方案和仿真报告 -负责芯片级到板级、整机的散热测试计划的制定和实施 -支持产品DVT/PVT等,支持工程、生产、售后等环节相关散热问题的闭环 -负责ODM/OEM厂家散热方案、散热测试计划和测试报告的把关和审查,跟踪散热相关问题的解决 -主导热设计平台的建设,完善热设计评估体系,不断优化热仿真模型精度, 提升热设计能力 -探索热设计、验证、材料工艺方向的新技术,驱动验证、引入、产品化落地