拼多多深度学习大模型推理系统研发专家

社招全职3年以上技术类2026-03-31地点：上海状态：招聘

扫码手机上打开

任职要求

1. 计算机，通信相关专业本科以上学历，3年以上后端服务开发经验
2. 精通Linux平台下的C/C++/Python语言, 具备扎实的编程功底与技术设计品味
3. 精通高性能计算,  熟悉CUDA/OpenMPI的编程,  熟悉tensorflow/pytorch/vllm/sglang 等框架的研发与使用
4. 有分布式系统相关研…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 从传统模型到深度模型,  从LLM到多模态Agent, 负责面向不同业务线的不同模型的在线推理系统, 是工程与算法的深度交融的舞台
2. 基于K8S的云原生在线生态系统, 承接大规模分布式系统的运维挑战,  提供产品化一站式的服务能力
3. 参与传统框架(tensorflow/pytorch/xgb)到LLM框架(vllm/sglang/lmdeploy), 以及编译优化(MLIR/TVM/Triton) 的持续研发与调优工作
4. 负责从底层算子调优, 模型编译, 框架调度, RDMA, PD分离部署, 多卡协同 等各个领域的研发与创新

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Linux+

C+

C+++

Python+

CUDA+

TensorFlow+

还有更多 •••

登录查看完整学习资料

相关职位

深度学习研究员(J19622)

校招研发技术类

1.负责大语言模型的预训练、后训练及分布式训练优化，设计并开发面向芯片设计、制造等环节的大模型智能体（Agent）架构，实现任务规划与工具调用能力； 2.跟踪多模态学习，强化学习等前沿技术方向，开展半导体领域创新研究，推进大模型基础设施（Infra）建设，完成训练与推理加速，软硬协同优化等关键技术落地； 3.运用深度学习与多模态技术（如图像理解、以图搜图、生成算法等），解决芯片设计、制造环节中的缺陷检测，分类识别与精准定位等实际问题，承担模型训练、调优、评估及效果验证全流程工作； 4.推动前沿算法研究成果向业务场景转化，持续提升半导体研发与制造智能化水平。

更新于 2026-06-12合肥|北京|上海

深度学习(J19615)

校招研发技术类

岗位职责 1、主导公司在半导体领域大模型的尖端研发，包括但不限于预训练模型调优，指令微调等核心技术； 2、对接业务需求，在产品设计、验证、制造和测试的环节中构建定制化大语言模型解决方案，以提升研发效率和良率； 3、密切关注大模型领域的最新动态，将前沿技术转化为实际应用，推动公司技术边界持续拓展。

更新于 2026-06-12合肥|北京|上海

深度学习AI编译和推理引擎研发工程师

实习阿里巴巴2027

1.参与设计和实现AI芯片上的推理引擎SDK，包括代码生成、图优化、算子实现/优化以及系统运行时的方面； 2.参与设计和实现AI芯片上的大语言模型推理框架。进行功能实现和性能优化。

更新于 2026-04-23杭州|上海

深度学习模型性能调优师-阿里星

实习阿里巴巴2027

1、训练后模型压缩(Post-Training Compression)，训练后量化(PTQ)是被验证有效且相对易用的模型压缩技术，可以探索将类似方法拓展应用至稀疏、更低比特量化、混合精度等更多情况； 2、参数高效(Parameter-Efficient)压缩训练，在大模型上进行全量参数的微调训练对算力资源有很高要求，叠加模型压缩引入的额外参数，会进一步增大算力资源开销，降低可训练参数或者进行高效的参数初始化，是提升压缩训练效率的重要因素。

更新于 2026-03-23北京|杭州|上海