小鹏汽车大模型部署实习生

实习兼职2026-04-10地点：深圳 | 北京 | 上海状态：招聘

扫码手机上打开

任职要求

1、本科及以上学历，计算机、电子工程等相关专业；
2、熟悉 C++/Python，具备模型部署或推理优化经验；
3、熟悉至少一种推理框架：TensorRT / ONNX Runtime / MNN / TVM / vLLM；
4、有以下至少一项经验：
- 模型量化（PTQ/QAT/混合精度）与精度-速度 trade-off 调优；
- CUDA 编程与 GPU kernel 优化；
- 嵌入式 NPU 部署（高通/联发科/NVI…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

负责将大语言模型、多模态模型和具身智能模型高效部署到机器人端侧芯片和云端，实现低延迟实时推理。
1、负责 VLT（任务规划模型）、Omni（多模态交互模型）、VLA（操作模型）等大模型在 XP5 芯片上的端侧部署，完成模型量化（INT8/INT4/FP8）、图优化和推理加速；
2、设计和优化云端模型推理服务（基于 vLLM/TensorRT-LLM），支撑 VLT 云端推理的高并发低延迟需求；
3、开发运动控制模型（ONNX）在实时系统中的高性能推理管道，满足 500Hz 控制频率要求；
4、建立模型部署的标准化流程：模型转换→量化→性能基准测试→端侧验证→上线发布；
5、与算法团队协作，从模型设计阶段介入，提供部署可行性评估和性能预估。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

C+++

Python+

TensorRT+

ONNX+

MNN+

vLLM+

还有更多 •••

登录查看完整学习资料

相关职位

【地瓜机器人】大模型推理与部署实习生（VLA/具身智能方向）

实习算法序列

1、参与VLA模型在仿真环境中的部署与运行，支持数据采集、任务执行与结果统计； 2、参与LLM/VLM/VLA模型的工程化训练与推理流程搭建，支持模型在不同配置下的运行与评测； 3、参与模型压缩、量化、推理加速等工程优化工作，对不同方案进行实验验证与性能对比； 4、配合完成模型部署相关的脚本、工具与文档，提升整体工程稳定性与可复现性。

更新于 2026-03-09北京

大模型部署与优化实习生 (Embodied AI)

实习

【关于我们】小鹏机器人中心致力于研发先进的人形机器人技术，包括机器人的行走、操作、智能导航，以及在大语言模型支持下的人机交互等。我们的软硬件团队覆盖深圳、上海、广州、北京和北美，组成了一支世界一流的跨领域团队。作为本团队的一员，你将成为连接人工智能与物理世界的桥梁，与其它领域的工程师共同解决前沿的科研和工程难题，并在机器人技术的发展中留下自己的印记。作为小鹏机器人核心团队的实习生，你将深入参与具身智能（Embodied AI）VLA 大模型的全链路优化工作，主要探索和负责以下领域：核心职责：参与具身 VLA 大模型的部署优化，熟悉算子优化、模型量化等原理。技术探索：参与研究和应用最新的大模型结构，探索软硬一体的高效模型部署设计方案，提升模型推理性能。团队协作：与算法、硬件及基础设施团队紧密合作，共同推进模型从训练到部署的迭代，解决前沿工程技术与算法论文在真实场景中的落地挑战。

更新于 2025-12-30深圳

大模型推理部署优化实习生-AI引擎

实习程序&技术类

1. 跟踪业界大模型推理技术发展趋势，调研并分析主流开源推理框架及相关工程实践。 2. 参与开源大模型的高性能推理部署与优化工作，包括但不限于 PD 分离、推理参数调优、并发性能优化、显存优化等方向。 3. 支撑 SGLang、vLLM 等主流开源推理框架的部署、适配、测试与性能评估。 4. 参与推理网关相关技术调研，包括请求调度、路由策略、负载均衡、多模型服务管理、限流熔断等能力分析。 5. 跟踪开源社区重要特性演进，参与问题定位、性能瓶颈分析及工程修复。 6. 沉淀部署实践、调研报告和性能优化经验，为团队大模型推理平台建设提供技术支撑。

上海

AI大模型部署系统研发工程师实习生

实习后端开发

核心职责参与小红书大模型平台推理部署等流程及工具的研发建设，完善平台现有功能参与平台Quota管理模块的开发，实现多机房、多集群环境下的，各种异构计算资源的配额管理功能参与平台大模型训练/压缩/推理/数据集/资源调度等流程及工具的研发建设

更新于 2026-02-12上海|北京