小鹏汽车ML编译器资深工程师/专家

社招全职2025-04-02地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

【岗位要求】
1、计算机科学/计算机工程/电气工程硕士及以上学位，或具有同等行业经验。 
2、优秀的C/C++开发能力。

【加分项】
1、在自动驾驶行业有相关经验。
…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

我们正在寻找一名全职的机器学习编译器工程师,对建立先进的机器学习编译器基础设施有深入的了解和强烈的热情，以便在通用目的GPU或定制SoC上部署先进的自动驾驶模型。

开发ML编译器，使机器学习模型能够在通用GPU或小鹏汽车定制的SoC芯片上运行，具体的工作包括：
1、clang/MLIR/LLVM编译器工具链开发，包括C/C++、汇编器、链接器。
2、各种前端优化，包括各种计算图优化。
3、各种后端优化，包括通过异构内存管理、分块和并行化。
4、测试和分析编译器部署的模型。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

C+

C+++

还有更多 •••

登录查看完整学习资料

相关职位

自动驾驶机器学习推理资深工程师/专家

社招

-我们正在寻找一名机器学习高级工程师-AI推理方向。理想的候选人需要拥有深厚的ML推理知识和强烈的热情来优化我们的模型，以最高效的利用我们的AI加速器的每一个FLOP和每一个字节的内存。 -我们的使命是解决自动驾驶难题。您将与才华横溢的软件工程师、机器学习工程师和研究科学家团队合作，推动最先进的自动驾驶人工智能。 1、为深度学习模型在小鹏定制的AI加速器上的部署做优化。 2、为小鹏的AI加速器编开发内核。 3、为关键内核的性能估计建立数学模型。

更新于 2024-11-28上海|北京

自动驾驶ML推理优化高级/资深工程师

社招

1、为深度学习模型在小鹏定制的AI加速器上的部署做优化。 2、为小鹏的AI加速器编开发内核。 3、为关键内核的性能估计建立数学模型。

更新于 2025-04-02北京|广州|深圳

AI基础设施架构师/高级AI基础设施研究员-基础架构

社招5年以上A50117

1、领导可扩展、可靠的AI基础设施（AI加速器、计算集群、存储、网络）的端到端设计，用于Training和Inference大模型工作负载； 2、定义并实现面向服务的容器化架构（Kubernetes、VM框架、Unikernels），优化ML性能和安全性； 3、分析和优化ML堆栈的每一层ML编译器、GPU/TPU调度、NCCL/RDMA网络、数据预处理和训练/推理框架，开发低开销Metrics和基准测试框架，以识别和消除分布式训练和Inference中的瓶颈； 4、构建和运营跨多个数据中心（本地和云）自动扩展的大规模部署和编排调度系统，通过智能资源管理和工作负载放置来支持容错、高可用性和成本效益； 5、为PB级大模型数据集量身定制强大的ETL和数据摄取管道（Spark/Beam/Dask/Flume），集成实验管理和工作流编排工具（Airflow、Kubeflow、Metaflow）以简化研究到生产的过程； 6、与机器学习研究人员合作，将原型需求转化为生产级系统，指导工程师在性能调整、系统设计和可靠性工程方面的最佳实践。

更新于 2025-05-29北京

高性能计算研发工程师-Ads Infra

社招A182521

1、针对广告/推荐/搜索等场景，优化模型训练/推理的计算图执行效率； 2、通过编译优化、模型并行优化、图融合、高性能算子开发、低精度计算、Memory复用、Cache优化、高并发服务请求优化等技术，打造业界领先的高性能训推引擎； 3、设计和开发高性能算子库，研究最新的GPU计算技术和优化方法，以充分利用GPU/NPU的并行计算能力，支持各种机器学习和深度学习模型的构建和部署； 4、负责机器学习系统前瞻技术的调研和引入，例如最新硬件架构、异构计算系统、GPU优化技术、编译优化技术的引入和落地。

更新于 2025-04-02北京