
商汤大装置-Agent生产平台DevOps工程师
任职要求
1. 扎实的 Python 编程能力,具备工程化代码习惯 2. 熟悉 Linux / Docker / Kubernetes / CI/CD 等 DevOps 基础能力 3. 对 LLM / Agent / RAG 的基本原理和工程落地问题有实际理解或经验 4. 具备较强的问题拆解能力与跨团队协作意识 加分项 1. 使用过 L…
工作职责
1. Agent 生产平台建设 构建并维护 AI Agent 的运行、部署与生命周期管理能力 支撑 Prompt、Agent 配置、模型与工具调用的版本化与可回滚 2. Agent 评估与可观测性 搭建 Agent 自动化评估(Evals)流水线,量化准确率、幻觉率、任务完成率等指标 建设面向 LLM / Agent 的全链路观测能力(调用链路、Token 成本、延迟等) 3. 基础设施与运维 维护 Agent 相关的推理服务、向量数据库与 API 网关 基于 Docker / Kubernetes 部署与管理 Agent 微服务架构 4. 成本、稳定性与安全 监控并优化 Agent 推理成本与性能 为 Agent 工具调用与代码执行设计安全隔离与沙盒机制

在导师指导下,参与大模型智能体(Agent)的开发与应用落地,包括但不限于: 1. 参与 Agent 应用的设计与实现,探索从对话到任务执行的智能体能力。 2. 协助设计和优化 Prompt 策略(如 CoT、ReAct),提升模型输出的稳定性与可用性。 3. 基于 LangChain、LlamaIndex 等框架,搭建 RAG(检索增强生成) 应用链路。 4. 实现 Agent 对外部工具的调用(API / 数据库 / 内部系统),支持简单的任务规划与自动化流程。 5. 参与 Demo、内部工具或实验性项目的开发与迭代。

负责基于大模型构建可落地、可复用的 AI Agent 应用与服务,让模型从“能对话”进化为“能完成任务”。 1. 基于主流大模型(如 Qwen、DeepSeek、SenseNova 等)设计并开发 AI Agent,解决真实业务问题。 2. 负责 Agent 核心能力开发,包括 任务规划、工具/API 调用、记忆机制(RAG)与结果校验。 3. 使用 LangChain / LangGraph / AutoGen 等框架,构建 单 Agent 或多 Agent 协作流程。 4. 编写和优化 Prompt,持续提升 Agent 输出的 稳定性、准确性和可控性。 5. 将 Agent 能力封装为 API 或服务,集成到现有业务系统中,并关注 效果、成本与延迟。

1. 负责大模型在应用平台/产品方向的发展规划,深入分析大模型应用场景,充分挖掘RAG、Agent等相关技术在产品应用中的潜力; 2. 高效协调多种业务需求方,与工程、研究、解决方案、销售团队密切配合,确保产品规划的落地实施与持续优化; 3. 积极收集内部用户、客户和潜在客户的反馈; 4..持续跟进大模型技术的发展趋势,提供专业的技术洞察和有针对性的产品策略,以帮助组织做出产品决策。

你将聚焦于 大模型 Agent 在真实业务场景中的算法设计与评估问题,推动 Agent 从“可用”走向“稳定与可控”,具体包括: 1. 设计并优化 Agent 与 RAG 相关算法方案,提升复杂任务下的准确性、稳定性与泛化能力。 2. 围绕 Agent 行为、模型输出质量与幻觉问题,设计系统化的评测方法(Evals),包括评测集、指标与自动化评估流程。 3. 结合业务场景,探索 模型微调、Prompt 策略或强化学习等方法,持续改进 Agent 表现。 4. 跟踪并复现 LLM / Agent 领域前沿研究,将有效方法转化为可落地的算法方案。 5. 输出算法相关成果,包括技术分享、内部文档、专利或论文(如适用)。