logo of sensetime

商汤模型部署工程师

社招全职5年以上算法工程地点:上海状态:招聘

任职要求


1.本科及以上学历,计算机科学、电子工程或自动化等相关专业;
2.5年以上工作经验,3年以上的嵌入式开发工作经验,
3.熟悉计算机系统体系架构,软件性能优化加速;
4.至少熟悉一种主流推理框架,如VLLM、HuggingFace Transformers,TensorRT等
4.熟悉Al训练框架(TensorFlowPyTorch、Caffe等)优先;
6.有NVIDIA、MediaTek、Qualcomm、地平线等平台部署经验者优先;
7.熟练掌握C/C++PythonGitCMake、Makefile等基本技能

工作职责


模型部署与优化工程师(端侧)
1.负责端上(Linux/Android)平台的模型部署;
2.负责大模型在NPU/DSP/GPU/CPU开发与部署;
3.负责大模型在端侧(NV/MTK/Qualcomm等)的量化及推理性能优化;
4.负责大模型测试工具的开发;
包括英文材料
学历+
vLLM+
TensorRT+
TensorFlow+
PyTorch+
C+
C+++
Python+
Git+
CMake+
相关职位

logo of xpeng
社招

负责自动驾驶端侧大模型的部署与优化工作; 研究并落地大模型优化相关技术,包括模型量化、算子优化等,推动在自动驾驶业务中的应用; 参与模型部署与优化工具链的研发工作; 与算法团队协同配合,完成从模型训练到部署的全链路优化,确保软硬件之间的高效协同。

更新于 2025-07-08
logo of horizon
社招算法序列

工作职责 1. 负责端到端自动驾驶模型在不同硬件平台上的部署与优化,参与模型评测; 2. 设计实现模型一致性评测工具链,确保跨平台一致性,识别并解决差异问题; 3. 参与软硬件协同优化设计。与硬件工程师协作,参与硬件设计和优化,提供模型在私有硬件平台的执行效率。

更新于 2025-09-09
logo of sensetime
社招算法工程

1. 负责端到端自动驾驶模型在不同硬件平台上的部署与优化,参与模型评测; 2. 设计实现模型一致性评测工具链,确保跨平台一致性,识别并解决差异问题; 3. 参与软硬件协同优化设计。与硬件工程师协作,参与硬件设计和优化,提供模型在私有硬件平台的执行效率。

更新于 2025-10-11
logo of sensetime
社招5年以上系统开发

1、负责端上(Linux/Android)平台的模型部署; 2、负责大模型在NPU/DSP/GPU/CPU开发与部署; 3、负责大模型在端侧的量化及推理性能优化; 4、 负责大模型测试工具的开发;

更新于 2025-03-19