平头哥平头哥-边缘AI芯片软件工程师-模型部署优化-上海
任职要求
1. 电子工程,计算机等相关专业硕士及以上学历 2. 具备3年以上AI推理优化相关工作经验,深刻理解并行计算和CUDA编程,熟悉TensorRT和TensorRT-LLM的模型部署和优化。 3. 熟悉边缘AI芯片上模型部署使用者优先,如自动…
工作职责
1. 与算法同事协作,负责端侧AI模型以及大模型(LLM, VLM, VLA) 的部署和推理优化,结合AI软硬件特性实现高性能计算和推理效率优化,包括但不限于多模型部署,多任务调度,多线程/多进程加速,多IP之间的高效数据交换和同步。 2. 负责系统调优和统筹AI算力资源使用,在保障任务实时性/稳定性的前提下,实现算力资源(CPU/GPU/NPU)和内存资源的高效利用。 3. 深入挖掘AI芯片软件栈和系统性能瓶颈,提出软硬件的加速解决方案和需求

1. 构建辅助驾驶/机器人场景的大模型端&云侧协同计算平台,支撑云&边&端平台的深度学习计算部署落地,打造计算机视觉在边缘计算行业的核心竞争力和解决方案; 2. 深度学习算法、LLM、语音应用成果转化,负责LLM、检测、分类、分割、3D等方向算法的工程化、服务化和产品化; 3. 异构计算芯片性能优化,在市场主流移动端SOC芯片——Qualcomm、MTK、Nvidia霸等,进行异构计算极致性能优化; 4. 算法SDK通用框架构建与优化,保证深度学习算法部署落地的高效稳定,可移植可扩展。

1. 构建大模型端&云侧协同计算平台,支撑云&边&端平台的深度学习计算部署落地,打造计算机视觉在边缘计算行业的核心竞争力和解决方案; 2. 深度学习算法、LLM、语音应用成果转化,负责LLM、检测、分类、分割、3D等方向算法的工程化、服务化和产品化; 3. 异构计算芯片性能优化,在市场主流移动端SOC芯片——Qualcomm、MTK、Nvidia霸等,进行异构计算极致性能优化; 4. 算法SDK通用框架构建与优化,保证深度学习算法部署落地的高效稳定,可移植可扩展;
1、跟踪行业最新技术动态,为公司的AI芯片技术发展提供前瞻性的建议和技术储备; 2、跟踪GPGPU/NPU行业最新动态、产品与技术架构,分析公司内外部业务系统需求,结合自研芯片架构,输出系统软硬件协同设计方案; 3、负责组织硬件平台、软件平台、生态平台等AI组件的SE专家,一起协同工作交付有竞争力的AI整体系统方案,并指导开发团队完成方案的开发交付落地; 4、推理基础设施方案设计,针对产品业务场景,优化模型在边缘设备(自研芯片平台、Jetson、机器人嵌入式系统)的部署性能,实现模型量化、动态计算图裁剪、异构硬件(GPU/NPU/FPGA)适配等关键技术;