logo of liauto

理想汽车大模型算法-硬件架构协同设计实习生

实习兼职算法地点:上海状态:招聘

任职要求


1、具备深度学习大模型算法原理多卡并行计算的理解,熟练掌握Python/C++,能够使用PyTorch或TensorFlow进行原型验证;
2、对异构硬件架构(GPU、NPU、FPGA等)和互联基础知识(NVLINK SWITCH、IB)有基本了解,具有计算机体系结构和…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、聚焦大模型推理/DPU (Data processing unit)计算/硬件互联方向,参与算法与硬件协同优化的系统性研究工作;
2、在Mentor的指导下,设计并实现软硬结合的加速/互联方案,支持模型在端/云不同硬件平台上的高效部署、推理;
3、参与高水平论文撰写与顶会(ISCA、HPCA、MLSys、ICML、NeurIPS等)投稿。
包括英文材料
深度学习+
大模型+
算法+
Python+
还有更多 •••
相关职位

logo of aliyun
实习阿里云研究型实习

本项目致力于解决大模型训练中的核心挑战:如何在确保模型效果的同时,通过技术创新降低训练所需的资源成本。本项目旨在通过算法优化、系统软件优化以及软硬件协同设计,来破解这一难题。具体地: (1)算法层面优化: 探索模型结构与算子实现的创新,力求在不牺牲模型效能的基础上,减少计算负担,加速训练过程; (2)系统软件优化: 深入优化深度学习编译器与内存管理系统,通过智能调度、算子融合等技术,最大化提升计算、存储、网络带宽等硬件资源的使用效率; (3)软硬结合优化: 针对特定硬件架构,定制化训练策略与实现方案,利用深度学习编译器优化,深度挖掘硬件潜力,实现训练加速。

更新于 2024-07-12杭州
logo of bytedance
实习A253623

团队介绍:字节芯片研发团队隶属于系统部,目前工作主要集中在芯片设计环节。该团队主要围绕字节自身业务展开芯片探索,为字节多项业务的专用场景定制硬件优化,设计多款基于先进半导体工艺的云端复杂芯片,以期提升性能、降低成本。早期若干芯片项目已经进入到量产部署阶段,有多次一版成功的投片经历,所用工艺包含多个主流的先进工艺节点。和系统部基础设施工作的整体协同,能更容易和更好地发挥芯片研发的价值。 课题介绍:探索电路、SoC和算法的协同架构;负责创新电路,架构和系统设计;与硬件设计团队合作,实现高协同的架构和系统设计。 研究方向:电路设计系统、芯片设计、半导体、机器学习、深度学习、计算机架构。 一、架构建模 1、负责AI芯片架构的探索与设计方案,包括计算/互联/存储等方向; 2、负责AI推理/训练系统的软硬件协同优化方案; 3、负责不同业务场景下AI模型结构和算子分析与硬件优化。 二、IP设计 1、负责数据中心内ASIC芯片的微架构探索、调研业界AI结构并完成量化分析、AI benchmark分析细化。 三、SoC设计 1、负责团队的技术视野储备。通过文献调研、技术交流、技术分享,增加团队对多个技术领域的技术积累; 2、参与软硬件协同设计,收集分析软硬件需求。平衡中后端,封装等系统限制,完成方案和IP的选择评估,确定芯片的功能特性和性能指标。参与定位并解决芯片的功能和性能问题; 3、理解系统需求,参与完成初始化流程、Debug、性能监测、异常处理等方案的制定; 4、负责SoC或子系统的架构文档撰写,完成硬件逻辑设计和优化; 5、负责SoC或子系统的执行交付工作,包括文档、代码、质量检查和其他交付件; 6、参与芯片项目完整执行过程,协助完成芯片的交付流程; 7、与封装和板级设计合作,理解系统限制,包括信号完整性、电源完整性、散热等。

更新于 2025-03-05上海
logo of bytedance
实习A19983

团队介绍:字节芯片研发团队隶属于系统部,目前工作主要集中在芯片设计环节。该团队主要围绕字节自身业务展开芯片探索,为字节多项业务的专用场景定制硬件优化,设计多款基于先进半导体工艺的云端复杂芯片,以期提升性能、降低成本。早期若干芯片项目已经进入到量产部署阶段,有多次一版成功的投片经历,所用工艺包含多个主流的先进工艺节点。和系统部基础设施工作的整体协同,能更容易和更好地发挥芯片研发的价值。 课题介绍:探索电路、SoC和算法的协同架构;负责创新电路,架构和系统设计;与硬件设计团队合作,实现高协同的架构和系统设计。 研究方向:电路设计系统、芯片设计、半导体、机器学习、深度学习、计算机架构。 一、架构建模 1、负责AI芯片架构的探索与设计方案,包括计算/互联/存储等方向; 2、负责AI推理/训练系统的软硬件协同优化方案; 3、负责不同业务场景下AI模型结构和算子分析与硬件优化。 二、IP设计 1、负责数据中心内ASIC芯片的微架构探索、调研业界AI结构并完成量化分析、AI benchmark分析细化。 三、SoC设计 1、负责团队的技术视野储备。通过文献调研、技术交流、技术分享,增加团队对多个技术领域的技术积累; 2、参与软硬件协同设计,收集分析软硬件需求。平衡中后端,封装等系统限制,完成方案和IP的选择评估,确定芯片的功能特性和性能指标。参与定位并解决芯片的功能和性能问题; 3、理解系统需求,参与完成初始化流程、Debug、性能监测、异常处理等方案的制定; 4、负责SoC或子系统的架构文档撰写,完成硬件逻辑设计和优化; 5、负责SoC或子系统的执行交付工作,包括文档、代码、质量检查和其他交付件; 6、参与芯片项目完整执行过程,协助完成芯片的交付流程; 7、与封装和板级设计合作,理解系统限制,包括信号完整性、电源完整性、散热等。

更新于 2025-03-05北京