理想汽车【实习生】算子编译器开发实习生-北京/上海
任职要求
1. 计算机、人工智能、电子、软件工程的直接相关专业,或数学、物理类专业,在读硕士及以上; 2. 熟练使用 C/C++ 语言和DNN 基础; 3. 熟悉 CPU/GP…
工作职责
1.参与基于 MLIR 的空间数据流 AI 编译器开发及各类 AI 负载(含大模型)的建模与量化分析;

1.探索基于大语言模型(LLM)的Coding Agent开发范式,推动**AI驱动的算子开发流程(Human + Agent协同)**落地 2.使用AI工具(如 Claude Code / Cursor / 自研Agent)参与高性能算子开发,包括: a.GPU方向:CUDA / C++算子开发与性能优化(访存、并行度、kernel fusion等) b.BPU方向:地平线BPU算子开发与优化(编译约束、算子映射、数据流优化等) 3.参与构建AI辅助算子开发体系,包括: a.Prompt设计与Agent workflow搭建 b.自动代码生成、自动调优、自动benchmark与回归验证 c.结合profiling工具进行性能分析与优化闭环 4.参与大模型推理系统中的关键算子优化(Attention / KV Cache / MoE等) 5.参与跨硬件平台的算子适配与优化(GPU ↔ BPU) 6.沉淀技术文档与最佳实践(CLAUDE.md、Skill等)

Agent 优化策略验证: 参与探索基于大模型 Agent 的编译优化闭环系统,尝试利用 LLM 进行自动化的代码分析、性能瓶颈定位和调优策略生成(Auto-Tuning)。 前沿模型结构分析: 深入分析当前主流及前沿的深度学习模型结构(特别是各类 Transformer 变体,以及包含 FlashAttention、Linear Attention 等特性的模型),提取其计算和访存特征,为底层算子优化提供指导。 高性能算子开发: 结合理论分析与 LLM 代码生成能力,参与编写和优化针对公司 AI 芯片的高性能算子,挑战极致的执行效率。 工具链生态沉淀: 协助开发基于 LLM 的内部辅助工具,优化编译团队的研发工作流。

前沿算法探索与复现: 跟踪学术界在 AI for Systems、强化学习(RL)等算法应用于编译优化领域的最新进展,探索评估各种算法在实际编译器场景中的潜力。 软硬件协同设计辅助: 参与下一代AI推理芯片的早期架构预研。协助构建AI驱动的性能评估模型,为指令集设计、存储层次划分等提供基于数据的分析支持。 性能基准测试: 针对不同的算子和网络结构,在底层架构(如GPU、TPU类芯片)上进行性能压测与瓶颈分析。