理想汽车【实习生】算子编译器开发实习生-北京/上海
任职要求
1. 计算机、人工智能、电子、软件工程的直接相关专业,或数学、物理类专业,在读硕士及以上; 2. 熟练使用 C/C++ 语言和DNN 基础; 3. 熟悉 CPU/GP…
工作职责
1.参与基于 MLIR 的空间数据流 AI 编译器开发及各类 AI 负载(含大模型)的建模与量化分析;

1.探索基于大语言模型(LLM)的Coding Agent开发范式,推动**AI驱动的算子开发流程(Human + Agent协同)**落地 2.使用AI工具(如 Claude Code / Cursor / 自研Agent)参与高性能算子开发,包括: a.GPU方向:CUDA / C++算子开发与性能优化(访存、并行度、kernel fusion等) b.BPU方向:地平线BPU算子开发与优化(编译约束、算子映射、数据流优化等) 3.参与构建AI辅助算子开发体系,包括: a.Prompt设计与Agent workflow搭建 b.自动代码生成、自动调优、自动benchmark与回归验证 c.结合profiling工具进行性能分析与优化闭环 4.参与大模型推理系统中的关键算子优化(Attention / KV Cache / MoE等) 5.参与跨硬件平台的算子适配与优化(GPU ↔ BPU) 6.沉淀技术文档与最佳实践(CLAUDE.md、Skill等)

Agent 优化策略验证: 参与探索基于大模型 Agent 的编译优化闭环系统,尝试利用 LLM 进行自动化的代码分析、性能瓶颈定位和调优策略生成(Auto-Tuning)。 前沿模型结构分析: 深入分析当前主流及前沿的深度学习模型结构(特别是各类 Transformer 变体,以及包含 FlashAttention、Linear Attention 等特性的模型),提取其计算和访存特征,为底层算子优化提供指导。 高性能算子开发: 结合理论分析与 LLM 代码生成能力,参与编写和优化针对公司 AI 芯片的高性能算子,挑战极致的执行效率。 工具链生态沉淀: 协助开发基于 LLM 的内部辅助工具,优化编译团队的研发工作流。

前沿算法探索与复现: 跟踪学术界在 AI for Systems、强化学习(RL)等算法应用于编译优化领域的最新进展,探索评估各种算法在实际编译器场景中的潜力。 软硬件协同设计辅助: 参与下一代AI推理芯片的早期架构预研。协助构建AI驱动的性能评估模型,为指令集设计、存储层次划分等提供基于数据的分析支持。 性能基准测试: 针对不同的算子和网络结构,在底层架构(如GPU、TPU类芯片)上进行性能压测与瓶颈分析。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节芯片研发团队隶属于系统部,目前工作主要集中在芯片设计环节。该团队主要围绕字节自身业务展开芯片探索,为字节多项业务的专用场景定制硬件优化,设计多款基于先进半导体工艺的云端复杂芯片,以期提升性能、降低成本。早期若干芯片项目已经进入到量产部署阶段,有多次一版成功的投片经历,所用工艺包含多个主流的先进工艺节点。和系统部基础设施工作的整体协同,能更容易和更好地发挥芯片研发的价值。 1、参与AI编译器的开发,模型量化等特性支持; 2、参与算子开发、算子编译及调优; 3、参与模型编译支持及优化; 4、参与Runtime框架研发; 5、软硬件协同优化、AI加速器评测相关工作; 6、业界前沿模型调研工作。