logo of xpeng

小鹏汽车ML编译器资深工程师/专家

社招全职地点:北京 | 上海状态:招聘

任职要求


【岗位要求】
1、计算机科学/计算机工程/电气工程硕士及以上学位,或具有同等行业经验。 
2、优秀的C/C++开发能力。

【加分项】
1、在自动驾驶行业有相关经验。
…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


我们正在寻找一名全职的机器学习编译器工程师,对建立先进的机器学习编译器基础设施有深入的了解和强烈的热情,以便在通用目的GPU或定制SoC上部署先进的自动驾驶模型。

开发ML编译器,使机器学习模型能够在通用GPU或小鹏汽车定制的SoC芯片上运行,具体的工作包括:
1、clang/MLIR/LLVM编译器工具链开发,包括C/C++、汇编器、链接器。
2、各种前端优化,包括各种计算图优化。
3、各种后端优化,包括通过异构内存管理、分块和并行化。
4、测试和分析编译器部署的模型。
包括英文材料
学历+
C+
C+++
还有更多 •••
相关职位

logo of xpeng
社招

-我们正在寻找一名机器学习高级工程师-AI推理方向。理想的候选人需要拥有深厚的ML推理知识和强烈的热情来 优化我们的模型,以最高效的利用我们的AI加速器的每一个FLOP和每一个字节的内存。 -我们的使命是解决自动驾驶难题。您将与才华横溢的软件工程师、机器学习工程师和研究科学家团队合作,推动最先进的自动驾驶人工智能。 1、为深度学习模型在小鹏定制的AI加速器上的部署做优化。 2、为小鹏的AI加速器编开发内核。 3、为关键内核的性能估计建立数学模型。

更新于 2024-11-28上海|北京
logo of xpeng
社招

1、为深度学习模型在小鹏定制的AI加速器上的部署做优化。 2、为小鹏的AI加速器编开发内核。 3、为关键内核的性能估计建立数学模型。

更新于 2025-04-02北京|广州|深圳
logo of bytedance
社招5年以上A50117

1、领导可扩展、可靠的AI基础设施(AI加速器、计算集群、存储、网络)的端到端设计,用于Training和Inference大模型工作负载; 2、定义并实现面向服务的容器化架构(Kubernetes、VM框架、Unikernels),优化ML性能和安全性; 3、分析和优化ML堆栈的每一层ML编译器、GPU/TPU调度、NCCL/RDMA网络、数据预处理和训练/推理框架,开发低开销Metrics和基准测试框架,以识别和消除分布式训练和Inference中的瓶颈; 4、构建和运营跨多个数据中心(本地和云)自动扩展的大规模部署和编排调度系统,通过智能资源管理和工作负载放置来支持容错、高可用性和成本效益; 5、为PB级大模型数据集量身定制强大的ETL和数据摄取管道(Spark/Beam/Dask/Flume),集成实验管理和工作流编排工具(Airflow、Kubeflow、Metaflow)以简化研究到生产的过程; 6、与机器学习研究人员合作,将原型需求转化为生产级系统,指导工程师在性能调整、系统设计和可靠性工程方面的最佳实践。

更新于 2025-05-29北京
logo of bytedance
社招A182521

1、针对广告/推荐/搜索等场景,优化模型训练/推理的计算图执行效率; 2、通过编译优化、模型并行优化、图融合、高性能算子开发、低精度计算、Memory复用、Cache优化、高并发服务请求优化等技术,打造业界领先的高性能训推引擎; 3、设计和开发高性能算子库,研究最新的GPU计算技术和优化方法,以充分利用GPU/NPU的并行计算能力,支持各种机器学习和深度学习模型的构建和部署; 4、负责机器学习系统前瞻技术的调研和引入,例如最新硬件架构、异构计算系统、GPU优化技术、编译优化技术的引入和落地。

更新于 2025-04-02北京