
商汤大装置-大模型 Agent 算法研究员
任职要求
1. 计算机、人工智能、数学等相关专业 硕士及以上学历,博士优先。 2. 在 机器学习 / 深度学习 / LLM 方向有较扎实的理论基础和实践经验。 3. 有 Agent / RAG / 模型微调 / LLM 评测 中至少一个方向的深入实践经验。 4. 具备良好的编程能力,熟练使用 Pyth…
工作职责
你将聚焦于 大模型 Agent 在真实业务场景中的算法设计与评估问题,推动 Agent 从“可用”走向“稳定与可控”,具体包括: 1. 设计并优化 Agent 与 RAG 相关算法方案,提升复杂任务下的准确性、稳定性与泛化能力。 2. 围绕 Agent 行为、模型输出质量与幻觉问题,设计系统化的评测方法(Evals),包括评测集、指标与自动化评估流程。 3. 结合业务场景,探索 模型微调、Prompt 策略或强化学习等方法,持续改进 Agent 表现。 4. 跟踪并复现 LLM / Agent 领域前沿研究,将有效方法转化为可落地的算法方案。 5. 输出算法相关成果,包括技术分享、内部文档、专利或论文(如适用)。

1.大模型应用开发:负麦基于主流开源/闭源大模型进行应用落地,包括问答系统、智能助手、知识检索、文档处理等;并与产品、前端、后端、数据团队紧密协作,推动算法模型在真实业务中的部署与落地。 2.RAG 系统优化:主导通用型 RAG(Retrieval-Augmented Generation)系统的构建与效果优化,包括召回、排序、长文本处理、多文档合成等关键环节。 3.Agent 框架开发:研究和实现多 Agent 协作框架,提高 Agent 在复杂任务中的稳定性与执行效果,探索如任务分解、工具使用、状态记忆等机制。 4.模型效果调优:结合业务场景,设计 Prompt、微调、评测等策略,提升大模型在特定任务中的表现。 5.技术积累与分享:沉淀可复用的模型应用框架、调优经验和评估指标,推动团队整体技术能力提升。

1. 负责实现和迭代自然语言处理相关算法,支撑企业数字化业务中的自然语言理解和生成需求,例如信息抽取、文档分析、检索问答、对话交互等; 2. 深度参与客户工程业务实现,将算法和企业业务需求应用相配合,实现客户端到端业务需求,实现LLM的落地最后一公里; 3. 积极跟进LLM SOTA技术,能够迅速在某一细分领域的深入掌握最新算法,包括但不限于基础模型跟进、推理框架优化、SFT训练及Agent智能体开发; 4. 设计和开发基于大语言模型(LLM)的智能Agent,优化其在不同业务场景中的任务规划、工具调用及自主决策能力; 5. 培训非LLM专业人员,使之具备基本标准业务落地AI赋能能力。

1. 负责商汤SenseCore AI云、大模型开发平台等产品项目落地的技术工作,包括云基础设施、大模型基础设施优化、大模型应用开发等业务架构设计,以及AI应用定制化开发的技术设计和技术管理工作; 2. 负责客户技术对接,协同公司内外部产品团队、售前团队以及项目管理团队,做好需求管理,参与并指导团队实施项目定制化开发工作,完成客户项目落地; 3. 拓展和对接合作伙伴,围绕产品构建解决方案和技术生态体系。

1.市场与客户洞察:深入研究企业服务(ToB)市场,挖掘不同行业客户在人工智能和大模型领域的应用场景与痛点,形成商业机会分析。 2.产品战略与规划:负责大模型相关应用产品的整体规划和战略方向,定义清晰的产品愿景、目标用户和核心价值主张,并制定可落地的产品路线图。 3.产品定义与设计:主导从0到1的产品孵化过程,独立完成产品需求文档、交互原型等的设计,并清晰地向团队阐述产品逻辑和设计思路。 4.技术方案整合:紧密与算法和工程团队协作,深度参与技术方案讨论。将客户需求转化为具体的技术实现路径,尤其是在RAG、模型微调、Agent智能体等关键技术应用上有深入思考和设计。 5.项目管理与推进:跨部门协调研发、算法、设计、测试等资源,管理产品开发的全生命周期,确保产品高质量、按时交付上线。 6.商业化与客户成功:参与产品的商业化路径设计,与售前、销售和客户成功团队合作,拜访标杆客户,收集一手市场反愦,并根据数据和反馈持续送代优化产品,驱动业务增长。