
商汤AI智能体平台架构师(Agent方向)
社招全职5年以上技术开发类地点:上海状态:招聘
任职要求
职位要求(Requirements) 1.计算机、人工智能、软件工程或相关专业本科及以上学历,5年以上分布式系统或AI平台开发经验,有从0到1构建复杂系统经验者优先。 2.精通至少一门后端编程语言:Go(强烈推荐) / Python / Rust / C++,具备良好的工程规范、模块化设计能力与高并发编程经验。 3.熟悉云原生技术栈:Kubernetes、Docker、gRPC、RE…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
职位职责(Responsibilities) 1.主导云端智能 Agent 的系统架构设计与核心模块开发,涵盖对话状态管理、意图推理、上下文建模、响应生成、工具调用(Tool Calling)及多模态决策逻辑。 2.设计并实现高可用、低延迟、可扩展的微服务架构,支撑百万级 QPS 的并发对话请求,保障系统稳定性与容灾能力。 推动大语言模型(LLM)在云端 Agent 中的深度集成,包括 Prompt 工程优化、上下文压缩、推理加速、缓存策略、Agent 编排框架等关键技术落地。 3.深入分析系统性能瓶颈,优化从请求接入、上下文检索、模型推理到响应生成的全链路延迟,持续提升 TTFB(首字节时间)与用户体验。 探索基于 RAG、Function Calling、Agent 记忆机制、个性化建模等前沿技术的工程实现路径,推动创新功能产品化。 4.与算法、产品、运维团队紧密协作,完成从技术预研、灰度发布到全量上线的全周期交付。
包括英文材料
学历+
分布式系统+
https://www.distributedsystemscourse.com/
The home page of a free online class in distributed systems.
https://www.youtube.com/watch?v=7VbL89mKK3M&list=PLOE1GTZ5ouRPbpTnrZ3Wqjamfwn_Q5Y9A
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Rust+
https://www.youtube.com/watch?v=BpPEoZW5IiY
In this comprehensive Rust course for beginners, you will learn about the core concepts of the language and underlying mechanisms in theory.
https://www.youtube.com/watch?v=lzKeecy4OmQ
Full Rust 101 Crash Course for beginners.
https://www.youtube.com/watch?v=rQ_J9WH6CGk
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
高并发+
https://www.baeldung.com/concurrency-principles-patterns
In this tutorial, we’ll discuss some of the design principles and patterns that have been established over time to build highly concurrent applications.
https://www.baeldung.com/java-concurrency
Handling concurrency in an application can be a tricky process with many potential pitfalls. A solid grasp of the fundamentals will go a long way to help minimize these issues.
https://www.oreilly.com/library/view/concurrency-in-go/9781491941294/
You’ll understand how Go chooses to model concurrency, what issues arise from this model, and how you can compose primitives within this model to solve problems.
https://www.oreilly.com/library/view/modern-concurrency-in/9781098165406/
With this book, you'll explore the transformative world of Java 21's key feature: virtual threads.
https://www.youtube.com/watch?v=qyM8Pi1KiiM
https://www.youtube.com/watch?v=wEsPL50Uiyo
Kubernetes+
https://kubernetes.io/docs/tutorials/kubernetes-basics/
This tutorial provides a walkthrough of the basics of the Kubernetes cluster orchestration system.
https://kubernetes.io/zh-cn/docs/tutorials/kubernetes-basics/
本教程介绍 Kubernetes 集群编排系统的基础知识。每个模块包含关于 Kubernetes 主要特性和概念的一些背景信息,还包括一个在线教程供你学习。
https://www.youtube.com/watch?v=s_o8dwzRlu4
Hands-On Kubernetes Tutorial | Learn Kubernetes in 1 Hour - Kubernetes Course for Beginners
https://www.youtube.com/watch?v=X48VuDVv0do
Full Kubernetes Tutorial | Kubernetes Course | Hands-on course with a lot of demos
Docker+
https://www.youtube.com/watch?v=GFgJkfScVNU
Master Docker in one course; learn about images and containers on Docker Hub, running multiple containers with Docker Compose, automating workflows with Docker Compose Watch, and much more. 🐳
https://www.youtube.com/watch?v=kTp5xUtcalw
Learn how to use Docker and Kubernetes in this complete hand-on course for beginners.
gRPC+
[英文] Introduction to gRPC
https://grpc.io/docs/what-is-grpc/introduction/
An introduction to gRPC and protocol buffers.
还有更多 •••
相关职位

社招2年以上技术类-开发
1、负责云原生容器平台和智能体平台的设计和开发,持续迭代平台能力; 2、参与基础应用开发框架和组件开发,深入参与业务落地,以确保技术的高效集成与实际落地。; 3、保基础平台系统架构的稳定、高效运行,帮助业务优化性能和改善系统稳定性。
更新于 2026-04-06广州
社招2年以上技术类-开发
1、负责云原生容器平台和智能体平台的设计和开发,持续迭代平台能力; 2、参与基础应用开发框架和组件开发,深入参与业务落地,以确保技术的高效集成与实际落地。; 3、保基础平台系统架构的稳定、高效运行,帮助业务优化性能和改善系统稳定性。
更新于 2026-06-05广州
社招技术类-开发
1、大模型关键技术突破,构建AI应用开发平台核心竞争力,支撑共享引擎大模型业务的快速推进和迭代。 2、洞察业界AI大模型应用开发平台的前沿技术,跟踪业界与学术界最新研究动态,围绕大模型应用的高成功率、高执行效率、低门槛,持续探索和突破大模型应用平台创新技术。 3、深度参与深度学习大模型产品研发,工程优化和应用过程中的技术落地,重点关注大模型部署、对齐、模型评估、推理优化加速等
更新于 2025-06-20北京
社招5年以上云智能行业解决方
1、深入理解客户业务需求,帮助客户选择适合其业务场景的技术路径和产品组合,利用AI技术知识、架构方法、咨询技能来影响客户技术决策 2、与客户合作进行模型训练、推理和模型应用等POC,含展示功能、调整模型、优化模型性能、测试分析、Agent搭建、模型调用等内容 3、依据客户需求和技术研判,推动产研部门持续优化产品,助力提升产品竞争力,同时沉淀最佳实践,以及脚本、模板、参考架构等可复用的技术资产 4、持续跟踪行业动态和技术趋势,并与产品团队协作,打造创新的人工智能(大模型、智算、一体机等)解决方案 5、支持市场活动,作为领域专家参与市场洞察、行业标准、市场排名报告、白皮书撰写等活动,并在行业峰会、技术沙龙等市场活动中进行技术传播和分享
更新于 2025-06-16北京|杭州|上海