logo of xpeng

小鹏汽车端侧模型部署工程师

社招全职地点:上海状态:招聘

任职要求


1、熟练掌握Python/C++编程语言,熟悉深度学习框架(如PyTorchTensorFlowONNX等);
2、熟悉模型部署流程,包括模型导出、转换、优化、打包等;
3、熟悉模型压缩与优化技术,如量化、剪枝、蒸馏等;
4、熟悉主流推理引擎(如TensorRT、OpenVINO、ONNX Runtime等),具备推理加速经验者优先;
5…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责深度学习模型的部署与优化,确保模型在目标硬件平台上的高效运行;
2、参与模型压缩、量化、剪枝等优化技术的研究与实现,提升模型在边缘设备上的推理效率;
3、与算法团队协作,将训练完成的模型封装为可部署的推理服务,支持多平台适配;
4、负责模型部署后的性能监控与调优,确保模型在不同硬件平台上的稳定性与一致性;
5、编写自动化部署脚本与测试用例,提升部署效率与自动化水平;
6、跟踪前沿技术,探索模型部署在边缘计算、嵌入式系统等场景下的应用潜力;
7、参与CUDA生态的底层算子开发与优化,提升模型在GPU平台上的推理性能;
8、与硬件团队协作,优化模型在异构计算平台(如GPU、NPU、DSP)上的部署方案;
包括英文材料
Python+
C+++
深度学习+
PyTorch+
TensorFlow+
ONNX+
还有更多 •••
相关职位

logo of xpeng
社招

负责自动驾驶端侧大模型的部署与优化工作; 研究并落地大模型优化相关技术,包括模型量化、算子优化等,推动在自动驾驶业务中的应用; 参与模型部署与优化工具链的研发工作; 与算法团队协同配合,完成从模型训练到部署的全链路优化,确保软硬件之间的高效协同。

更新于 2025-07-08北京
logo of xpeng
社招3年以上

1、负责将复杂的AI模型优化并部署到端侧硬件平台,比如NVIDIA等系列(包括Orin、Xavier、Nano等)。 2、优化模型以满足实时处理的需求,并确保在资源受限的设备上高效运行。 3、负责实现优化模型中部分算子实现,使其在合适的平台(CPU/GPU/DSP等)部署运行,提升模型效率。 4、参与跨部门项目,确保技术解决方案满足业务需求。 5、持续跟踪最新的AI研究进展,并评估其在端侧部署中的可行性。 6、编写技术文档,包括部署指南、性能评估报告和故障排除手册等。

更新于 2024-11-28深圳|上海
logo of tencent
社招3年以上出行行业应用技术

1.负责座舱端侧大模型量化部署,如高通/MTK/Nvidia等座舱芯片平台; 2.探索不同芯片平台的算子能力与工程新特性,设计不同的量化策略与验证方法,优化量化前后精度损失; 3.负责端侧大模型部署过程中的性能优化,优化token生成速度与减少内存带宽的使用; 4.研究端侧大模型前沿的量化部署方法,提升端侧大模型整体性能与精度。

更新于 2025-12-05深圳
logo of mi
社招A247898

1. 负责自动驾驶端侧模型的部署和优化工作 2. 负责模型部署&优化工具链的研发 3. 对模型部署优化技术展开研究,并落地到自动驾驶

更新于 2025-05-26北京