
商汤AI智能体平台架构师(Agent方向)
任职要求
职位要求(Requirements) 1.计算机、人工智能、软件工程或相关专业本科及以上学历,5年以上分布式系统或AI平台开发经验,有从0到1构建复杂系统经验者优先。 2.精通至少一门后端编程语言:Go(强烈推荐) / Python / Rust / C++,具备良好的工程规范、模块化设计能力与高并发编程经验。 3.熟悉云原生技术栈:Kubernetes、Docker、gRPC、REST、消息队列(Kafka/RabbitMQ)、Prometheus/Grafana 监控体系,具备大规模服务部署与运维能力。 4.深入理解大语言模型(LLM)的工作机制,具备 LLM 在实际业务中落地经验,包括:Prompt 设计与自动化优化上下文管理与长记忆处理推理加速(vLLM、TensorRT-LLM、模型量化)Function Calling / Tool Use 的工程实现
工作职责
职位职责(Responsibilities) 1.主导云端智能 Agent 的系统架构设计与核心模块开发,涵盖对话状态管理、意图推理、上下文建模、响应生成、工具调用(Tool Calling)及多模态决策逻辑。 2.设计并实现高可用、低延迟、可扩展的微服务架构,支撑百万级 QPS 的并发对话请求,保障系统稳定性与容灾能力。 推动大语言模型(LLM)在云端 Agent 中的深度集成,包括 Prompt 工程优化、上下文压缩、推理加速、缓存策略、Agent 编排框架等关键技术落地。 3.深入分析系统性能瓶颈,优化从请求接入、上下文检索、模型推理到响应生成的全链路延迟,持续提升 TTFB(首字节时间)与用户体验。 探索基于 RAG、Function Calling、Agent 记忆机制、个性化建模等前沿技术的工程实现路径,推动创新功能产品化。 4.与算法、产品、运维团队紧密协作,完成从技术预研、灰度发布到全量上线的全周期交付。
1、深入理解客户业务需求,帮助客户选择适合其业务场景的技术路径和产品组合,利用AI技术知识、架构方法、咨询技能来影响客户技术决策 2、与客户合作进行模型训练、推理和模型应用等POC,含展示功能、调整模型、优化模型性能、测试分析、Agent搭建、模型调用等内容 3、依据客户需求和技术研判,推动产研部门持续优化产品,助力提升产品竞争力,同时沉淀最佳实践,以及脚本、模板、参考架构等可复用的技术资产 4、持续跟踪行业动态和技术趋势,并与产品团队协作,打造创新的人工智能(大模型、智算、一体机等)解决方案 5、支持市场活动,作为领域专家参与市场洞察、行业标准、市场排名报告、白皮书撰写等活动,并在行业峰会、技术沙龙等市场活动中进行技术传播和分享
1、深入理解客户业务需求,帮助客户选择适合其业务场景的技术路径和产品组合,利用AI技术知识、架构方法、咨询技能来影响客户技术决策 2、与客户合作进行模型训练、推理和模型应用等POC,含展示功能、调整模型、优化模型性能、测试分析、Agent搭建、模型调用等内容 3、依据客户需求和技术研判,推动产研部门持续优化产品,助力提升产品竞争力,同时沉淀最佳实践,以及脚本、模板、参考架构等可复用的技术资产 4、持续跟踪行业动态和技术趋势,并与产品团队协作,打造创新的人工智能(大模型、智算、一体机等)解决方案 5、支持市场活动,作为领域专家参与市场洞察、行业标准、市场排名报告、白皮书撰写等活动,并在行业峰会、技术沙龙等市场活动中进行技术传播和分享
1、深入理解客户业务需求,帮助客户选择适合其业务场景的技术路径和产品组合,利用AI技术知识、架构方法、咨询技能来影响客户技术决策 2、与客户合作进行模型训练、推理和模型应用等POC,含展示功能、调整模型、优化模型性能、测试分析、Agent搭建、模型调用等内容 3、依据客户需求和技术研判,推动产研部门持续优化产品,助力提升产品竞争力,同时沉淀最佳实践,以及脚本、模板、参考架构等可复用的技术资产 4、持续跟踪行业动态和技术趋势,并与产品团队协作,打造创新的人工智能(大模型、智算、一体机等)解决方案 5、支持市场活动,作为领域专家参与市场洞察、行业标准、市场排名报告、白皮书撰写等活动,并在行业峰会、技术沙龙等市场活动中进行技术传播和分享