logo of xpeng

小鹏汽车端侧模型部署工程师

社招全职地点:上海状态:招聘

任职要求


1、熟练掌握Python/C++编程语言,熟悉深度学习框架(如PyTorchTensorFlowONNX等);
2、熟悉模型部署流程,包括模型导出、转换、优化、打包等;
3、熟悉模型压缩与优化技术,如量化、剪枝、蒸馏等;
4、熟悉主流推理引擎(如TensorRT、OpenVINO、ONNX Runtime等),具备推理加速经验者优先;
5、熟悉Linux系统开发与调试,具备脚本编写能力;
6、熟悉自动驾驶系统架构,了解模型在感知、决策、控制等模块中的应用;
7、熟悉CUDA生态,具备CUDA算子开发或优化经验者优先;
8、了解异构计算平台(如GPU、NPU、DSP)的部署与优化,有相关经验者优先;
9、熟悉典型自动驾驶/多模态模型结构,包括感知、决策、控制等模块的集成与部署。

工作职责


1、负责深度学习模型的部署与优化,确保模型在目标硬件平台上的高效运行;
2、参与模型压缩、量化、剪枝等优化技术的研究与实现,提升模型在边缘设备上的推理效率;
3、与算法团队协作,将训练完成的模型封装为可部署的推理服务,支持多平台适配;
4、负责模型部署后的性能监控与调优,确保模型在不同硬件平台上的稳定性与一致性;
5、编写自动化部署脚本与测试用例,提升部署效率与自动化水平;
6、跟踪前沿技术,探索模型部署在边缘计算、嵌入式系统等场景下的应用潜力;
7、参与CUDA生态的底层算子开发与优化,提升模型在GPU平台上的推理性能;
8、与硬件团队协作,优化模型在异构计算平台(如GPU、NPU、DSP)上的部署方案;
包括英文材料
Python+
C+++
深度学习+
PyTorch+
TensorFlow+
ONNX+
推理引擎+
TensorRT+
Linux+
脚本+
自动驾驶+
CUDA+
相关职位

logo of xpeng
社招

负责自动驾驶端侧大模型的部署与优化工作; 研究并落地大模型优化相关技术,包括模型量化、算子优化等,推动在自动驾驶业务中的应用; 参与模型部署与优化工具链的研发工作; 与算法团队协同配合,完成从模型训练到部署的全链路优化,确保软硬件之间的高效协同。

更新于 2025-07-08
logo of xpeng
社招3年以上

1、负责将复杂的AI模型优化并部署到端侧硬件平台,比如NVIDIA等系列(包括Orin、Xavier、Nano等)。 2、优化模型以满足实时处理的需求,并确保在资源受限的设备上高效运行。 3、负责实现优化模型中部分算子实现,使其在合适的平台(CPU/GPU/DSP等)部署运行,提升模型效率。 4、参与跨部门项目,确保技术解决方案满足业务需求。 5、持续跟踪最新的AI研究进展,并评估其在端侧部署中的可行性。 6、编写技术文档,包括部署指南、性能评估报告和故障排除手册等。

更新于 2024-11-28
logo of mi
社招A247898

1. 负责自动驾驶端侧模型的部署和优化工作 2. 负责模型部署&优化工具链的研发 3. 对模型部署优化技术展开研究,并落地到自动驾驶

更新于 2025-05-26
logo of mi
实习

1. 负责自动驾驶算法的车端部署和优化 2. 基于车载异构计算硬件对自动驾驶算法进行性能测评、加速 3. 参与模型部署优化工具链的设计与研发,如模型转换、图优化、量化等

更新于 2025-04-21