logo of aligenie

智能互联平头哥-边缘AI芯片软件工程师-模型部署优化-上海

社招全职5年以上技术-芯片地点:上海状态:招聘

任职要求


1. 电子工程,计算机等相关专业硕士及以上学历
2. 具备3年以上AI推理优化相关工作经验,深刻理解并行计算和CUDA编程,熟悉TensorRTTensorRT-LLM的模型部署和优化。
3. 熟悉边缘AI芯片上模型部署使用者优先,如自动…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 与算法同事协作,负责端侧AI模型以及大模型(LLM, VLM, VLA) 的部署和推理优化,结合AI软硬件特性实现高性能计算和推理效率优化,包括但不限于多模型部署,多任务调度,多线程/多进程加速,多IP之间的高效数据交换和同步。
2. 负责系统调优和统筹AI算力资源使用,在保障任务实时性/稳定性的前提下,实现算力资源(CPU/GPU/NPU)和内存资源的高效利用。
3. 深入挖掘AI芯片软件栈和系统性能瓶颈,提出软硬件的加速解决方案和需求
包括英文材料
学历+
CUDA+
TensorRT+
大模型+
还有更多 •••
相关职位

logo of thead
社招5年以上技术-芯片

1. 与算法同事协作,负责端侧AI模型以及大模型(LLM, VLM, VLA) 的部署和推理优化,结合AI软硬件特性实现高性能计算和推理效率优化,包括但不限于多模型部署,多任务调度,多线程/多进程加速,多IP之间的高效数据交换和同步。 2. 负责系统调优和统筹AI算力资源使用,在保障任务实时性/稳定性的前提下,实现算力资源(CPU/GPU/NPU)和内存资源的高效利用。 3. 深入挖掘AI芯片软件栈和系统性能瓶颈,提出软硬件的加速解决方案和需求

更新于 2026-02-04上海
logo of thead
社招5年以上技术-芯片

1. 与算法同事协作,负责端侧AI模型以及大模型(LLM, VLM, VLA) 的部署和推理优化,结合AI软硬件特性实现高性能计算和推理效率优化,包括但不限于多模型部署,多任务调度,多线程/多进程加速,多IP之间的高效数据交换和同步。 2. 负责系统调优和统筹AI算力资源使用,在保障任务实时性/稳定性的前提下,实现算力资源(CPU/GPU/NPU)和内存资源的高效利用。 3. 深入挖掘AI芯片软件栈和系统性能瓶颈,提出软硬件的加速解决方案和需求

更新于 2026-03-30上海
logo of thead
社招7年以上技术-芯片

1. 从功耗的维度参与软硬件协同策略和芯片总体架构方案设计 2. 负责芯片功耗场景的分析和定义,完成芯片总体功耗目标的制定,并将总体目标分解至各个子系统 3. 设计SoC低功耗架构,包括供电架构(Voltage domain, Power rail和Power domain)和Power Sequence,从PMIC到IP级的电源网络方案,Thermal方案,DVFS方案,Clock domain,以及不同层次的Clock gating方案等 4. 定义SoC和每个子系统的Power state,唤醒方案,以及相应功耗指标 5. 构建SoC层面的性能和功耗仿真平台和验证模型,负责芯片关键功耗场景的环境搭建、仿真验证、功耗测试及结果分析,指导优化算法和前端RTL设计 6. 根据功耗仿真与测试等结果,与软件和硬件团队合作,优化微架构和软硬件策略,提升芯片能效 7. 了解边缘AI芯片技术和性能/功耗优化技术的最新进展,探索新的性能/功耗方法学

更新于 2026-01-28上海
logo of thead
社招5年以上技术-芯片

1. 参与多媒体相关(ISP, Display, Video Codec, GPU等)的三方IP评估和选型 2. 负责多媒体IP和子系统驱动,HAL, 中间件,框架的设计和开发 3. 负责多媒体IP和子系统的系统验证 4. 负责芯片参考设计中的多媒体和感知相关部分的方案设计和开发

更新于 2026-01-19上海