
智能互联平头哥-边缘AI芯片软件工程师-模型部署优化-上海
任职要求
1. 电子工程,计算机等相关专业硕士及以上学历 2. 具备3年以上AI推理优化相关工作经验,深刻理解并行计算和CUDA编程,熟悉TensorRT和TensorRT-LLM的模型部署和优化。 3. 熟悉边缘AI芯片上模型部署使用者优先,如自动…
工作职责
1. 与算法同事协作,负责端侧AI模型以及大模型(LLM, VLM, VLA) 的部署和推理优化,结合AI软硬件特性实现高性能计算和推理效率优化,包括但不限于多模型部署,多任务调度,多线程/多进程加速,多IP之间的高效数据交换和同步。 2. 负责系统调优和统筹AI算力资源使用,在保障任务实时性/稳定性的前提下,实现算力资源(CPU/GPU/NPU)和内存资源的高效利用。 3. 深入挖掘AI芯片软件栈和系统性能瓶颈,提出软硬件的加速解决方案和需求
1. 与算法同事协作,负责端侧AI模型以及大模型(LLM, VLM, VLA) 的部署和推理优化,结合AI软硬件特性实现高性能计算和推理效率优化,包括但不限于多模型部署,多任务调度,多线程/多进程加速,多IP之间的高效数据交换和同步。 2. 负责系统调优和统筹AI算力资源使用,在保障任务实时性/稳定性的前提下,实现算力资源(CPU/GPU/NPU)和内存资源的高效利用。 3. 深入挖掘AI芯片软件栈和系统性能瓶颈,提出软硬件的加速解决方案和需求
1. 与算法同事协作,负责端侧AI模型以及大模型(LLM, VLM, VLA) 的部署和推理优化,结合AI软硬件特性实现高性能计算和推理效率优化,包括但不限于多模型部署,多任务调度,多线程/多进程加速,多IP之间的高效数据交换和同步。 2. 负责系统调优和统筹AI算力资源使用,在保障任务实时性/稳定性的前提下,实现算力资源(CPU/GPU/NPU)和内存资源的高效利用。 3. 深入挖掘AI芯片软件栈和系统性能瓶颈,提出软硬件的加速解决方案和需求
1. 从功耗的维度参与软硬件协同策略和芯片总体架构方案设计 2. 负责芯片功耗场景的分析和定义,完成芯片总体功耗目标的制定,并将总体目标分解至各个子系统 3. 设计SoC低功耗架构,包括供电架构(Voltage domain, Power rail和Power domain)和Power Sequence,从PMIC到IP级的电源网络方案,Thermal方案,DVFS方案,Clock domain,以及不同层次的Clock gating方案等 4. 定义SoC和每个子系统的Power state,唤醒方案,以及相应功耗指标 5. 构建SoC层面的性能和功耗仿真平台和验证模型,负责芯片关键功耗场景的环境搭建、仿真验证、功耗测试及结果分析,指导优化算法和前端RTL设计 6. 根据功耗仿真与测试等结果,与软件和硬件团队合作,优化微架构和软硬件策略,提升芯片能效 7. 了解边缘AI芯片技术和性能/功耗优化技术的最新进展,探索新的性能/功耗方法学