
商汤大装置-深度学习平台架构师
社招全职系统开发地点:北京 | 上海 | 深圳状态:招聘
任职要求
1.深入理解深度学习相关框架(比如 Pytorch、Tensorflow 等) 2.深入理解分布式深度学习相关技术(比如 MPI Allreduce、Parameter Server 等)以及常用框架(比如 Open MPI、NCCL 等) 3.深入理解 GPU 体系结构和虚拟化技术 4.了解任务调度系统(基于Kubernetes的调度方案,以及SLURM等) 加分项 1.有大模型训练产品的开发经验 2.有云服务计算相关产品的开发经验
工作职责
1.参与构建下一代 AI 基础设施 2.不断提升大模型训练和推理的性能 3.使用异构设备(包括 GPU、ASIC等)不断提升深度学习训练和推理的性能和效率
包括英文材料
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
Kubernetes+
https://kubernetes.io/docs/tutorials/kubernetes-basics/
This tutorial provides a walkthrough of the basics of the Kubernetes cluster orchestration system.
https://kubernetes.io/zh-cn/docs/tutorials/kubernetes-basics/
本教程介绍 Kubernetes 集群编排系统的基础知识。每个模块包含关于 Kubernetes 主要特性和概念的一些背景信息,还包括一个在线教程供你学习。
https://www.youtube.com/watch?v=s_o8dwzRlu4
Hands-On Kubernetes Tutorial | Learn Kubernetes in 1 Hour - Kubernetes Course for Beginners
https://www.youtube.com/watch?v=X48VuDVv0do
Full Kubernetes Tutorial | Kubernetes Course | Hands-on course with a lot of demos
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
相关职位

社招10年以上系统研究
1. 负责商汤SenseCore AI云、大模型开发平台等产品项目落地的技术工作,包括云基础设施、大模型基础设施优化、大模型应用开发等业务架构设计,以及AI应用定制化开发的技术设计和技术管理工作; 2. 负责客户技术对接,协同公司内外部产品团队、售前团队以及项目管理团队,做好需求管理,参与并指导团队实施项目定制化开发工作,完成客户项目落地; 3. 拓展和对接合作伙伴,围绕产品构建解决方案和技术生态体系。
更新于 2025-04-09

实习技术族-实习
1. 负责商汤SenseCore AI智算数据中心以及大模型应用开发平台等产品的项目落地交付软件设计、开发工作; 2. 在架构师的指导下,主导软件的开发、需求整理等工作。
更新于 2025-09-05

社招1-3年后端开发
支持商汤SenseCore AI智算数据中心以及大模型应用开发平台等多产品的技术设计、开发工作; 开发并维护高可用,易扩展的后端服务; 优化后端服务的性能和可扩展性,分析并解决系统中的性能瓶颈; 设计和实现高效的 API 以及微服务架构,支持复杂的业务逻辑需求; 与前端、算法、DevOps 以及其他后端团队密切合作,共同推动技术解决方案的落地。
更新于 2025-09-29