
商汤大装置-大模型算法开发高级工程师
任职要求
1. 熟练掌握C++、Python等编程语言的一种或多种,具备良好的编码能力。 2. 有大型工程项目经验,代码风格严谨高效。 3. 熟悉多线程/多进程开发,拥有扎实的计算机体系结构、计算机网络、数据结构基础。 4. 熟悉开源开发工具https://github.com/LazyAGI/LazyLLM(可提前了解) 加分项 1. 熟练掌握深度学习框架Pytorch,熟悉colossal-AI, deepspeed, internEvo…
工作职责
开发https://github.com/LazyAGI/LazyLLM 【注意】此岗位对编程要求较高,面试前欢迎先了解项目,会展开交流。 1. 结合业务落地的经验,探索并形成各个垂直领域应用定制开发的标准作业程序(SOP),沉淀到LazyLLM中 2. 打造灵活高效的场景应用建设方案,搭建从数据到训练、微调、部署、推理、评测、交付的低代码大模型应用生产SDK。 3. 与公司内外的行业伙伴合作,打造端到端解决方案能力,探索如一体机、私有化应用开发平台、国产芯片等业务交付新形态。

负责企业大模型项目的落地交付,面向客户现场提供定制化算法解决方案。利用大模型与多智能体方法,针对具体业务需求进行算法设计、模型调优及效果验证。指导交付团队解决技术问题,确保方案高效、准确地实现。岗位工作涵盖算法应用、业务问题建模及客户方案交付。 主要工作内容: 1. 深入理解客户业务需求,提供可落地的AI解决方案 2. 基于大模型及多智能体方法,结合客户的需求,进行算法定制与优化 3. 指导低阶交付同学解决算法问题,保障交付质量 4. 参与客户现场交流和方案演示,解答技术问题

1. 负责商汤SenseCore AI智算数据中心以及大模型应用开发平台等产品的项目落地技术设计、开发工作; 2. 协同公司内外部产品团队、售前团队以及项目管理团队,做好需求管理,参与项目定制化开发工作,完成客户项目落地。

1.大模型应用开发:负麦基于主流开源/闭源大模型进行应用落地,包括问答系统、智能助手、知识检索、文档处理等;并与产品、前端、后端、数据团队紧密协作,推动算法模型在真实业务中的部署与落地。 2.RAG 系统优化:主导通用型 RAG(Retrieval-Augmented Generation)系统的构建与效果优化,包括召回、排序、长文本处理、多文档合成等关键环节。 3.Agent 框架开发:研究和实现多 Agent 协作框架,提高 Agent 在复杂任务中的稳定性与执行效果,探索如任务分解、工具使用、状态记忆等机制。 4.模型效果调优:结合业务场景,设计 Prompt、微调、评测等策略,提升大模型在特定任务中的表现。 5.技术积累与分享:沉淀可复用的模型应用框架、调优经验和评估指标,推动团队整体技术能力提升。

1.大模型应用开发:负麦基于主流开源/闭源大模型进行应用落地,包括问答系统、智能助手、知识检索、文档处理等;并与产品、前端、后端、数据团队紧密协作,推动算法模型在真实业务中的部署与落地。 2.RAG 系统优化:主导通用型 RAG(Retrieval-Augmented Generation)系统的构建与效果优化,包括召回、排序、长文本处理、多文档合成等关键环节。 3.模型效果调优:结合业务场景,设计 Prompt、微调、评测等策略,提升大模型在特定任务中的表现。 4.技术积累与分享:沉淀可复用的模型应用框架、调优经验和评估指标,推动团队整体技术能力提升。