
商汤IAG-云端模型部署优化工程师
社招全职算法工程地点:北京 | 上海状态:招聘
任职要求
1、熟练掌握PyTorch/TensorFlow等框架的模型导出与部署全流程,熟练掌握TensorRT/ONNX Runtime等推理引擎; 2、具备扎实的C++/Python编程能力和CUDA编程经验…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责将智驾算法团队研发的云端大模型(如感知模型、自动标注模型)进行高效的部署、优化与服务化; 2、设计并实现高性能的模型推理服务,保障其高可用与低延迟; 3、运用模型压缩、编译优化及算子融合等技术,显著提升模型在GPU集群上的推理效率与资源利用率; 4、构建并维护一体化的模型部署与监控平台;
包括英文材料
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
TensorRT+
https://docs.nvidia.com/deeplearning/tensorrt/latest/getting-started/quick-start-guide.html
This TensorRT Quick Start Guide is a starting point for developers who want to try out the TensorRT SDK; specifically, it demonstrates how to quickly construct an application to run inference on a TensorRT engine.
ONNX+
https://github.com/onnx/tutorials
Open Neural Network Exchange (ONNX) is an open standard format for representing machine learning models.
[英文] Introduction to ONNX
https://onnx.ai/onnx/intro/
This documentation describes the ONNX concepts (Open Neural Network Exchange).
还有更多 •••
相关职位

社招
1.负责将智驾算法团队研发的云端大模型(如感知模型、自动标注模型)进行高效的部署、优化与服务化。 2.设计并实现高性能的模型推理服务,保障其高可用与低延迟; 3.运用模型压缩、编译优化及算子融合等技术,显著提升模型在GPU集群上的推理效率与资源利用率; 4.构建并维护一体化的模型部署与监控平台。
更新于 2025-12-02

社招5年以上算法研究
1、负责智驾云端融合算法总体方案设计与核心模块研发,包括多源数据(车辆端感知结果、轨迹、地图、交通与路侧感知等)的时空对齐、关联与融合建模; 2、主导云端目标融合、轨迹预测、风险评估与全局路径/策略生成,并与车端算法形成闭环。构建大规模数据融合与评估体系,支撑模型真值生产融合优化; 3、推进融合算法在云端分布式架构上的高可用、高性能部署,参与平台技术规划与演进,提高团队整体技术水平;
更新于 2025-11-19

社招5年以上算法工程
1、负责智能驾驶核心模块(感知/预测/决策)云端算法设计与优化,主导云端方案、云端建模、云端训练完整闭环,对精度、鲁棒性和实时性指标负责; 2、解决复杂长尾场景云端问题,推动数据闭环与工程落地,并在团队中承担技术负责人角色;
更新于 2025-11-18