logo of liauto

理想汽车AI算子开发工程师-北京

校招全职算法地点:北京状态:招聘

任职要求


1. 计算机、人工智能、软件工程、电子信息等直接相关专业,或数学、物理类专业,硕士及以上学历;
2. 逻辑清晰,具备抽象总结思考能力,熟悉 CPU/GPU/NPU 等计算机体系结构、以及操作系统/编译器等系统软件架构;
3. 熟练使用 C/C++ 语言,Python/Shell脚本,参与过大型软件项目开发;
4. 有过 MLIR/Triton/TVM 等 AI 编译器实践者优先;
5. 有过 CPU/GPU/NPU ,高性能计算开发,以及性能量化分析实践者优先;
6. 有竞赛获奖或高水平论文发表者优先。

工作职责


1. 参与面向空间数据流推理芯片架构、基于 MLIR 框架的AI 算子编译器/算子库开发;
2. 参与包括AI大模型在内的各类 AI 负载的端到端编译,自动编译生成算子代码实现;
3. 根据模型负载和硬件架构特性,对AI负载进行热点分析和性能优化;
4. 参与软硬一体 AI 推理芯片架构的落地。
包括英文材料
学历+
C+
C+++
Python+
Bash+
脚本+
相关职位

logo of antgroup
社招5年以上技术类-开发

1、负责基于异构计算SoC,针对大模型等AI应用场景的性能优化; 2、参与芯片SoC架构分析、优化算法的硬件实现,确保系统性能、功耗和成本的平衡; 3、参与软硬件规划、接口定义等;

更新于 2025-06-03
logo of antgroup
社招2年以上技术类-开发

● 参与以GPU等AI芯片为基础的高性能计算项目,深度分析GPU硬件体系结构,建设打磨极致的算子优化和显存优化等技术,逼近硬件理论性能峰值,突破大模型训推的显存墙,提升蚂蚁异构计算集群的硬件效率。 ● 针对蚂蚁大模型训推的性能和效率等问题,持续迭代算子库、显存优化技术和工具链,构建AI系统生态。 ● 持续跟踪行业前沿技术,参与开源社区的贡献。

更新于 2025-06-18
logo of antgroup
社招3年以上技术-开发

1、全同态/AI编译器开发:设计并实现高效的编译器框架,支持全同态加密或AI模型的自动编译与优化。开发编译器前端、中间表示(IR)及后端,确保编译器能够高效处理复杂的数学运算和加密逻辑。优化编译器性能,提升生成代码的执行效率和资源利用率。 2、算子DSL设计与实现:设计并实现领域特定语言(DSL),用于描述全同态加密或AI算子的数学表达式和计算流程。确保DSL具备良好的可扩展性,支持多种硬件平台和算法需求。提供清晰的DSL接口文档和开发者工具链,降低用户使用门槛。 3、算子优化:针对全同态加密或AI算子进行深度优化,包括但不限于内存访问模式、并行化策略和硬件加速。分析现有算子的性能瓶颈,提出并实施优化方案,显著提升计算效率。探索新型算法和硬件架构(如GPU、TPU、FPGA等)在算子优化中的应用。 4、跨团队协作:与算法团队、硬件团队及产品团队紧密合作,确保编译器和算子优化方案满足实际业务需求。参与技术讨论和代码评审,推动团队技术水平的整体提升。 5、技术研究与创新:跟踪全同态加密和AI领域的最新研究成果,探索其在编译器优化中的潜在应用。发表相关技术论文或专利,提升公司在行业内的技术影响力。

更新于 2025-09-24
logo of kuaishou
社招D7198

1.参与AI与GPU相关项目的性能优化与研发,通过利用并行计算优化、架构优化、量化优化和异构调度等高性能优化技术,研发行业领先的高性能异构AI优化技术与编译优化技术; 2.针对搜广推、音视频以及大模型场景,优化大模型训练和推理场景的性能; 3.与公司各算法部门深度合作,对重点项目进行算法与系统的联合优化。

更新于 2025-04-10