
智能互联达摩院-性能分析专家-AI、机器人、RISCV 方向
任职要求
1. 计算机、电子工程、自动化或相关专业本科及以上学历; 2. 3 年以上系统性能分析与性能优化工程经验; 3. 精通 Linux 性能分析工具链(如:perf/ftrace/eBPF/sysstat) 4. 熟悉主流 Benchmark 工具(如 spec…
工作职责
1. 负责全栈性能测试体系建设,设计并实现覆盖内核、中间件到应用层(如SLAM、目标检测、图形渲染)的自动化 Benchmark 框架,并针对机器人、边缘AI等业务场景定制关键性能用例; 2. 完成深度性能问题诊断与解决,运用 perf、ftrace、eBPF 等工具对操作系统、处理器指令效率、I/O 及系统集成层面的性能瓶颈进行根因分析,并推动有效优化; 3. 提供性能验证与交付支撑,建立性能数据采集、可视化与回归检测 pipeline,制定验收标准,输出标准化报告,支撑版本发布与产品交付; 4. 跨团队技术协同,参与需求与架构评审,从性能视角提供输入,并协助测试团队设计用例、解读结果,确保系统整体性能目标达成;

1、从事RISC-V CPU 编译器的研发工作,包括编译器架构设计、优化遍开发、应用程序性能分析调优等工作; 2、基于 MLIR + Linalg 框架,提升编译器代码块执行效率; 3、参与图优化、后端代码生成、调度策略、指令优化、流水并行化相关优化工作; 4、研究和优化 Kernel 计算性能,降低计算开销,提高吞吐率; 5、研究算子融合(Op Fusion)、自动调优(Auto-Tuning)、代码生成(CodeGen)相关优化策略; 6、与硬件团队、AI 框架团队(如 PyTorch)协作,提升 AI 编译器的支持能力; 跟踪 LLVM、Triton、TVM、XLA、TorchInductor 等 AI 编译器前沿技术,优化编译性能。

一、团队管理 ● 负责芯片工具链团队的组建、管理与梯队建设,打造高效能研发团队 ● 制定团队技术路线图,规划产品迭代计划,把控项目进度与质量 ● 建立团队技术规范与研发流程,推动工程效率持续提升 二、产品规划与设计 ● 主导芯片全流程开发工具链的整体架构设计,构建端到端的AI应用开发解决方案 ● 规划并落地以下核心工具模块: ○ 算子开发工具:算子设计、工程创建、单元测试、异常检测、调试调优等全链路工具 ○ 训练开发工具:模型迁移分析、精度调试、性能调优、内存检测等训练场景工具 ○ 推理开发工具:模型量化压缩、推理精度调试、性能调优、负载均衡、Benchmark评测等推理场景工具 ○ 可视化工具:模型结构可视化、训练过程可视化、性能数据可视化分析平台 ○ 诊断分析工具:内存泄漏检测、性能瓶颈分析、精度问题定位等诊断工具 ● 跟踪业界主流AI框架发展趋势,确保工具链的兼容性与易用性 ● 攻克大模型训练与推理场景下的性能优化、精度调试等关键问题的工具设计与研发难题 三、生态建设 ● 与芯片设计、编译器、Runtime等团队紧密协作,推动软硬件协同优化 ● 建立开发者社区,输出技术文档、最佳实践与案例教程,赋能开发者生态

1. 负责AI推理服务的全流程测试,覆盖模型加载、动态批处理、精度验证、资源占用等关键环节 2. 验证AI异构硬件(GPU/NPU/CPU)与推理引擎的性能表现及兼容性 3. 构建高并发AI服务压力测试框架,通过多用户场景下的QPS、P99延迟、错误率等指标评估服务稳定性与容错能力 4. 设计高性能AI推理基准测试方案,验证模型在低延迟/高吞吐量场景下的优化效果(内存占用率、硬件加速效率)及瓶颈分析 5. 分析推理瓶颈并提出优化建议,参与CI/CD流程的自动化测试集成

本职位旨在领导和管理SoC的硬件原型验证平台(如基于FPGA或Emulation系统),确保为芯片系统级验证(System Validation)和早期软件开发(Software Bring-up)提供高效、稳定且功能完备的开发基座。对原型平台的资源策略、技术实现及团队能力建设负全面责任。 一、 原型资源战略规划与环境管理 1. 资源评估与基础设施建设:负责硬件原型验证资源(包括Cadence Palladium、Synopsys Zebu、或特定FPGA原型板如HAPS等)的技术评估、容量规划与预算管理。主导**原型验证环境(Prototyping Lab)**的搭建、维护与优化,确保原型平台资源(如功耗、散热、稳定性)高效且持续地满足项目各个阶段的验证需求。 2. 跨项目协同与资源调度:建立有效的原型资源调度机制,优化不同设计与验证团队之间的资源分配,提升原型平台的利用率与周转效率。 二、 平台移植、交付与架构演进 1. 多平台移植架构设计:规划并设计多个代际/功能原型平台(通常为2-3个并行平台)的架构移植方案、功能裁减策略和资源映射。重点关注关键子系统(如PCIe接口、DDR内存控制器、AI计算核阵列)在原型环境中的准确实现和性能匹配。 2. 版本控制与质量交付: 全面负责**原型平台的周期性交付(Version Release)**管理,确保平台版本的稳定性和可追溯性。 领导团队进行复杂硬件/软件协同问题的快速定位(Debugging)和系统级故障排除,确保原型平台的交付质量。 三、 团队能力建设与流程优化 1. 流程与规范建设:制定并完善原型平台开发、集成、测试和维护的标准化操作流程(SOP)和技术规范,提升团队的协作效率和可重复性。 2. 任务管理与绩效提升:负责团队的任务优先级划分、资源分配与进度跟踪。通过定期的技术复盘(Post-Mortem Analysis)和知识分享,推动团队成员在原型技术、调试方法及系统架构理解方面的专业成长。