字节跳动SoC架构工程师-AI芯片(上海)
任职要求
1、微电子、计算机等相关专业本科及以上学历,5年及以上SoC架构/设计经验; 2、熟悉SoC架构(如业界主流的AI芯片架构等),有高性能或先进工艺SoC架构经验者优先;熟悉CPU体系结构(如X86、ARM、RISC-V等),有CPU架构/设计经验者优先; 3、熟悉NoC架构设计,有云端芯片NoC架构/设计经验者优先;熟悉DDR/PCIe/Ethernet/D2D等高速接口协议,有高速互联架构/设计经验者优先; 4、了解时钟复位设计,有SoC顶层集成经验者优先;了解芯片设计的中后端和封测流程,有相关项目经验者优先; 5、对主流AI算法有一定理解,有将AI算法映射到SoC数据流项目经验优先;对系统软件有一定理解,有软硬件协同设计经验者优先; 6、有较强的系统分析与问题解决能力。
工作职责
1、对接需求方,进行系统性需求拆解,转化为SoC架构层面可实现的技术规格; 2、参与SoC架构的顶层设计,负责编写SoC Top规格文档; 3、参与SoC各子系统IP选型、规格定义与架构设计,确保各子系统间高效协同工作; 4、负责SoC的统一地址空间和访问关系规划,满足各子系统数据交互需求; 5、负责SoC的RAS架构设计,满足系统级可靠性指标需求;组织SoC内跨子系统其他架构问题讨论,负责相关SoC顶层方案设计; 6、参与SoC顶层集成、性能调优、功耗分析等方案设计;参与软硬件协同架构讨论,负责相关SoC硬件方案设计。
1、跟踪GPGPU/NPU行业最新动态、产品与技术架构,分析公司内部业务系统需求,结合自研芯片架构,输出系统软硬件协同设计方案; 2、负责自研AI加速芯片系统软件栈的开发交付,包括芯片设备侧Firmware/Host侧驱动/系统管理诊断工具; 3、负责自研AI加速芯片的NPU/CIM存算方向的软硬协同验证,性能分析优化,基于可编程接口进行算子用例开发; 4、负责NPU IP的软件栈移植适配与集成,包括NPU IP的Firmware/驱动/Runtime/SDK。
-参与AI芯片的SoC架构设计与研发 -参与IP选型、SOC集成、架构设计、RTL开发等工作 -参与SOC的clock/reset/PAD/OTP/low power设计 -参与ip集成验证并且tape out等全流程
1、创新应用和模型结构分析和建模:对新MoE模型,Transformer优化模型,非Transformer模型,语音模型,视觉模型进行计算特征,访存特征,通信特征分析建模; 2、推理系统优化技术:基于应用特征,自顶向下分析推理软件栈可优化手段,从推理调度,KV Cache管理,推理引擎,算子,并行切进行协同优化; 3、模型压缩:探索低精度损失的低比特量化(如INT4/INT2量化)或稀疏化等算法,缓解大模型推理计算与内存开销; 4、长序列优化:通过序列压缩、序列并行等算法,在有限的部署资源上(如单机)实现1M甚至10M长序列高效推理; 5、提供高性能轻量级AI推理引擎:分析当前CPU执行AI推理的性能瓶颈,通过先进AI算法技术(比如Sparsicity等)和编译优化技术(auto-tiling等),结合BW芯片众核、大带宽、高矢量的架构特征,挑战性能天花板,推动AI4Compiler技术切实落地。 【课题名称】 大模型负载分析和推理系统优化。 【课题内容】 结合端侧设备的功耗、面积和实时性限制,探索自动优化方法研究,沉淀算子、模型及应用级优化方法,识别加速最优解决方案,并能够实施自动化化优化技术研究&应用。实现计算过程中的高效协同,发挥各类计算单元的有效算力;在算力墙、内存墙、通信墙等各维度平衡取舍发挥系统综合最优性能。