
商汤大装置-大模型算法应用实习生

1. 参与商汤自主研发的深度学习框架的研发与优化。工作目标是优化大数据工业级应用条件下的深度学习核心架构。 2. 适配深度学习算法与架构,对框架进行调整、改进和优化。 3. 对框架的训练速度进行优化,包括计算和通信及其调度,以提高模型训练的效率。 4. 扩充深度学习框架的功能和计算能力,完善工具体系。 5. 开发框架支持大模型推理、微调、训练的能力。

1. 负责商汤SenseCore AI智算数据中心以及大模型应用开发平台等产品的项目落地交付软件设计、开发工作; 2. 在架构师的指导下,主导软件的开发、需求整理等工作。

1.大模型应用开发:负麦基于主流开源/闭源大模型进行应用落地,包括问答系统、智能助手、知识检索、文档处理等;并与产品、前端、后端、数据团队紧密协作,推动算法模型在真实业务中的部署与落地。 2.RAG 系统优化:主导通用型 RAG(Retrieval-Augmented Generation)系统的构建与效果优化,包括召回、排序、长文本处理、多文档合成等关键环节。 3.模型效果调优:结合业务场景,设计 Prompt、微调、评测等策略,提升大模型在特定任务中的表现。 4.技术积累与分享:沉淀可复用的模型应用框架、调优经验和评估指标,推动团队整体技术能力提升。

1.大模型应用开发:负麦基于主流开源/闭源大模型进行应用落地,包括问答系统、智能助手、知识检索、文档处理等;并与产品、前端、后端、数据团队紧密协作,推动算法模型在真实业务中的部署与落地。 2.RAG 系统优化:主导通用型 RAG(Retrieval-Augmented Generation)系统的构建与效果优化,包括召回、排序、长文本处理、多文档合成等关键环节。 3.Agent 框架开发:研究和实现多 Agent 协作框架,提高 Agent 在复杂任务中的稳定性与执行效果,探索如任务分解、工具使用、状态记忆等机制。 4.模型效果调优:结合业务场景,设计 Prompt、微调、评测等策略,提升大模型在特定任务中的表现。 5.技术积累与分享:沉淀可复用的模型应用框架、调优经验和评估指标,推动团队整体技术能力提升。