logo of aligenie

智能互联达摩院-AI编译开发专家-处理器基础开发工具

社招全职4年以上技术-芯片地点:北京 | 杭州 | 上海状态:招聘

任职要求


1、计算机、自动化和电子类相关专业,本科及以上学历。
2、熟悉NPU/GPU/DSP等硬件计算单元特性,对某优化策略有深入研究。
3、熟悉深度学习编译相关工作,有丰富的…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、从事RISC-V CPU 编译器的研发工作,包括编译器架构设计、优化遍开发、应用程序性能分析调优等工作;
2、基于 MLIR + Linalg 框架,提升编译器代码块执行效率;
3、参与图优化、后端代码生成、调度策略、指令优化、流水并行化相关优化工作;
4、研究和优化 Kernel 计算性能,降低计算开销,提高吞吐率;
5、研究算子融合(Op Fusion)、自动调优(Auto-Tuning)、代码生成(CodeGen)相关优化策略;
6、与硬件团队、AI 框架团队(如 PyTorch)协作,提升 AI 编译器的支持能力;
跟踪 LLVM、Triton、TVM、XLA、TorchInductor 等 AI 编译器前沿技术,优化编译性能。
包括英文材料
学历+
还有更多 •••
相关职位

logo of aligenie
社招5年以上技术-芯片

1. 负责AI推理服务的全流程测试,覆盖模型加载、动态批处理、精度验证、资源占用等关键环节 2. 验证AI异构硬件(GPU/NPU/CPU)与推理引擎的性能表现及兼容性 3. 构建高并发AI服务压力测试框架,通过多用户场景下的QPS、P99延迟、错误率等指标评估服务稳定性与容错能力 4. 设计高性能AI推理基准测试方案,验证模型在低延迟/高吞吐量场景下的优化效果(内存占用率、硬件加速效率)及瓶颈分析 5. 分析推理瓶颈并提出优化建议,参与CI/CD流程的自动化测试集成

更新于 2026-04-07杭州|上海
logo of aligenie
社招8年以上技术-芯片

一、团队管理 ● 负责芯片工具链团队的组建、管理与梯队建设,打造高效能研发团队 ● 制定团队技术路线图,规划产品迭代计划,把控项目进度与质量 ● 建立团队技术规范与研发流程,推动工程效率持续提升 二、产品规划与设计 ● 主导芯片全流程开发工具链的整体架构设计,构建端到端的AI应用开发解决方案 ● 规划并落地以下核心工具模块: ○ 算子开发工具:算子设计、工程创建、单元测试、异常检测、调试调优等全链路工具 ○ 训练开发工具:模型迁移分析、精度调试、性能调优、内存检测等训练场景工具 ○ 推理开发工具:模型量化压缩、推理精度调试、性能调优、负载均衡、Benchmark评测等推理场景工具 ○ 可视化工具:模型结构可视化、训练过程可视化、性能数据可视化分析平台 ○ 诊断分析工具:内存泄漏检测、性能瓶颈分析、精度问题定位等诊断工具 ● 跟踪业界主流AI框架发展趋势,确保工具链的兼容性与易用性 ● 攻克大模型训练与推理场景下的性能优化、精度调试等关键问题的工具设计与研发难题 三、生态建设 ● 与芯片设计、编译器、Runtime等团队紧密协作,推动软硬件协同优化 ● 建立开发者社区,输出技术文档、最佳实践与案例教程,赋能开发者生态

更新于 2026-04-07北京|杭州|上海
logo of aligenie
社招3年以上技术-芯片

1. 负责AI全栈测试,涵盖大语言模型(LLM)、视觉模型(CNN/Transformer等)的精度验证、性能测试。 2. 负责AI工具链测试,包括模型编译优化、量化部署及NPU相关固件、算子、多芯片互联等功能与性能验证; 3. 负责RISC-V工具链测试,包括调试工具(GDB扩展/Trace)及编译器(LLVM/GCC定制)的测试; 4. 设计和执行测试方案,覆盖单元测试、集成测试、系统测试全流程,开发自动化测试用例; 5. 负责AI推理服务全流程测试,包括模型加载、动态批处理、精度验证、资源监控等; 6. 开展AI推理性能基准测试,分析硬件加速效率与瓶颈,提出优化建议;构建高并发压力测试框架,评估服务在QPS、P99延迟、错误率等指标下的稳定性;

更新于 2026-04-07上海
logo of aligenie
社招5年以上技术-芯片

● 负责芯片软件栈架构设计,包括但不限于调度系统设计、编译系统设计、计算系统设计、分布式系统设计。 ● 负责大规模分布式训练和推理的软件系统性能优化方案的设计,针对芯片架构特点提出合理的解决方案。 ● 负责各软件组件之间的协同设计,以及软件与硬件的协同设计,能够基于产品要求提出对硬件的明确需求。 ● 追踪行业动态,基于公司的AI芯片架构特点提出前瞻性的建议以及技术储备。

更新于 2026-04-07北京|上海