logo of liauto

理想汽车AI算子开发工程师-杭州

校招全职算法地点:杭州状态:招聘

任职要求


1. 计算机、人工智能、软件工程、电子信息等直接相关专业,或数学、物理类专业,硕士及以上学历;
2. 逻辑清晰,具备抽象总结思考能力,熟悉 CPU/GPU/NPU 等计算机体系结构、以及操作系统/编译器等系统软件架构;
3. 熟练使用 C/C++ 语言,Python/Shell脚本,参与过大型软件项目开发;
4. 有过 MLIR/Triton/TVM 等 AI 编译器实践者优先;
5. 有过 CPU/GPU/NPU ,高性能计算开发,以及性能量化分析实践者优先;
6. 有竞赛获奖或高水平论文发表者优先。

工作职责


1. 参与面向空间数据流推理芯片架构、基于 MLIR 框架的AI 算子编译器/算子库开发;
2. 参与包括AI大模型在内的各类 AI 负载的端到端编译,自动编译生成算子代码实现;
3. 根据模型负载和硬件架构特性,对AI负载进行热点分析和性能优化;
4. 参与软硬一体 AI 推理芯片架构的落地。
包括英文材料
学历+
C+
C+++
Python+
Bash+
脚本+
相关职位

logo of liauto
校招算法

1、参与面向空间数据流推理芯片架构、基于 MLIR 框架的AI 算子编译器/算子库开发; 2、参与包括AI大模型在内的各类 AI 负载的端到端编译,自动编译生成算子代码实现; 3、根据模型负载和硬件架构特性,对AI负载进行热点分析和性能优化; 4、参与软硬一体 AI 推理芯片架构的落地。

logo of nio
社招3-5年算法

职位描述: 1.负责AI处理器的高性能算子方案设计,功能开发,性能优化工作; 2.负责算子自测试用例的设计和开发,保证算子的质量提升和 CI 看护; 3.探索AI高性能算子的软硬件协同优化方案,提升硬件的利用效率 4.开发算子库开发所需的功能和性能分析工具,提升算子库开发效率

更新于 2025-05-26
logo of antgroup
社招2年以上技术类-开发

● 参与以GPU等AI芯片为基础的高性能计算项目,深度分析GPU硬件体系结构,建设打磨极致的算子优化和显存优化等技术,逼近硬件理论性能峰值,突破大模型训推的显存墙,提升蚂蚁异构计算集群的硬件效率。 ● 针对蚂蚁大模型训推的性能和效率等问题,持续迭代算子库、显存优化技术和工具链,构建AI系统生态。 ● 持续跟踪行业前沿技术,参与开源社区的贡献。

更新于 2025-06-18
logo of alibaba
社招3年以上技术类-开发

1. 负责大模型训练和推理系统的研发和性能优化,包括性能计算性能优化,大模型推理框架,大模型流量调度,高效 CUDA 算子开发,低精度计算,高并发服务请求优化等打造领先的推理引擎。 2. 负责大模型训练和推理等前瞻性技术架构的调研和引入,不限于子图匹配、编译优化、模型量化等。 3. 与算法团队深度合作,进行算法和系统的联合优化,包括分析业务性能瓶颈,通过软硬结合的 方式,高效部署和优化 AIGC 核心业务模型,建设 AI 工具链等能力,支撑 AI 业务的高速发展。

更新于 2025-09-24