蚂蚁金服蚂蚁集团-芯片架构-计算核(FHE/AI/CPU)-北京/上海【蚂蚁密算】
任职要求
1、计算机、电子工程、微电子等相关专业硕士及以上学历,8年以上芯片架构/前端设计经验 2、对以下两种算法及应用有深入理解 (有一种即可) * 常用的深度学习算法 * 全同态加密算法 3、熟悉计算机体系结构,对高性能处理器、GPGPU、AI DSA有深入理解 4、有GPU、AI Core、NPU、高性能CPU核的架构和设计经验 5、熟悉芯片的PPA优化(性能、功耗、面积),参与过自研芯片从需求设计到量产的全链路工作 6、优秀的团队合作能力
工作职责
1、负责蚂蚁自研芯片计算核规格定义和架构设计 2、负责计算核性能评估和分析,联合设计和软件团队完成关键模块微架构设计、IP选型和架构优化 3、联合算法团队分析并理解算法需求,指导后续计算核的迭代和优化
负责设计和构建自研NPU编译器及工具链的核心架构;特别是跨模块接口设计、硬件抽象定义、编程模型设计、关键性能考量等方面。 1、编译器架构设计:聚焦于编译器(包含运行时)各模块间的接口设计。 硬件抽象定义:定义合理的NPU硬件抽象,在跨平台和发掘硬件效率之间找到最佳平衡。 2、开发者界面定义:定义编程模型和工具链界面,提升自定义算子开发和模型适配效能。 3、前沿技术研究:跟踪编译器技术(如MLIR、LLVM)、AI芯片架构及深度学习框架的最新进展,探索创新性解决方案。
1、参与NPU系统的RTL设计; 2、根据微架构设计文档,独立完成重要模块比如指令队列,标量核,总线接口模块等模块的设计; 3、支持验证团队,配合验证完成覆盖率的分析与优化; 4、根据需求进行性能、功耗、面积迭代优化 ,对接中后端团队完成后端设计; 5、支持数字电路从RTL到GDSII的实现:逻辑综合,形式验证,低功耗分析优化,以及时钟分析、时序约束、STA signoff等工作; 6、支持综合、Formal,Timing flow 的搭建和维护。
1、负责基于高通/MTK平台的CPU EAS调度器的优化,包括大小核调度,负载计算算法,调频算法负载均衡算法,CFS等; 2、负责从用户场景出发,理解用户场景的CPUEAS调度器的重点优化方向; 3、能够理解高通/MTK平台的ARM CPU的芯片架构,负责基于底层的CPU架构进行CPUEAS的调度器的软硬件结合的优化,包括CPU的EMCPU的电源架构,CPU的微架构等方向: 4、解决项目上遇到的CPU EAS调度器的场景性能和功耗相关痛点问题。

一、职位概述 负责基于NVIDIA Orin/Thor芯片的控制器BSP开发与集成,主导相机视频链路构建、驱动开发及BSP镜像定制化,确保DriveOS系统在车载/边缘计算等场景的高效稳定运行。需深度参与硬件-操作系统适配、性能优化及全链路问题攻关。 二、岗位职责 1. BSP开发与集成: 1-1、负责NVIDIA Orin/Thor平台的BSP移植、裁剪与优化,包括Uboot引导、Linux内核配置、设备树定制及根文件系统构建; 1-2、开发并维护相机驱动(Camera Driver),实现视频采集链路(基于NVSIPL/NVStream/NVMedia框架),支持多路高分辨率视频流处理(如4K/8K)及低延时传输; 1-3、定制BSP镜像:调整分区策略、启动流程、CPU绑核策略(Affinity)、内存管理配置,优化系统实时性与资源利用率。 2. 框架与工具链开发: 2-1、基于NVIDIA生态(CUDA/NVMedia)开发硬件加速模块,优化AI推理与图像处理性能; 2-1、设计并实现DriveOS的适配层,解决上下游模块(如自动驾驶中间件、应用层)的兼容性问题。 3. 问题定位与调优: 3-1、主导DriveOS系统级故障排查(如内核崩溃、驱动兼容性、视频流中断),结合JTAG/逻辑分析仪进行硬件协同调试; 3-2、优化系统功耗、启动时间及实时性,确保满足车载控制器低延迟、高可靠性要求。 4. 协作与交付: 4-1、协同硬件团队完成芯片Bringup、信号测试及外设验证(如MIPI CSI/DSI、PCIe接口); 4-2、编写BSP设计文档、接口规范及问题解决方案,为应用层团队提供底层技术支持。