
商汤大装置-大模型算法高级交付工程师/专家
任职要求
1. 熟悉RAG、大模型微调、指令调优及多智能体算法,有一定的技术视野和技术判断 2. 有企业现场交付经验,能够快速理解业务问题并提出解决方案 3. 具备优秀的沟通能力,能够在客户现场独立与客户进行需求交流和方案沟通 4.…
工作职责
负责企业大模型项目的落地交付,面向客户现场提供定制化算法解决方案。利用大模型与多智能体方法,针对具体业务需求进行算法设计、模型调优及效果验证。指导交付团队解决技术问题,确保方案高效、准确地实现。岗位工作涵盖算法应用、业务问题建模及客户方案交付。 主要工作内容: 1. 深入理解客户业务需求,提供可落地的AI解决方案 2. 基于大模型及多智能体方法,结合客户的需求,进行算法定制与优化 3. 指导低阶交付同学解决算法问题,保障交付质量 4. 参与客户现场交流和方案演示,解答技术问题

开发https://github.com/LazyAGI/LazyLLM 【注意】此岗位对编程要求较高,面试前欢迎先了解项目,会展开交流。 1. 结合业务落地的经验,探索并形成各个垂直领域应用定制开发的标准作业程序(SOP),沉淀到LazyLLM中 2. 打造灵活高效的场景应用建设方案,搭建从数据到训练、微调、部署、推理、评测、交付的低代码大模型应用生产SDK。 3. 与公司内外的行业伙伴合作,打造端到端解决方案能力,探索如一体机、私有化应用开发平台、国产芯片等业务交付新形态。

你将参与构建和演进公司 MaaS 推理基础设施,支撑多模态大模型在多集群环境下的高效、稳定与低成本运行,具体包括: 1. 参与或主导 推理网关与核心服务 的设计与开发,支持多模态请求处理、流式推理、Micro-batch 调度等能力。 2. 参与 跨集群服务发现、健康检查与流量治理,提升推理系统的可用性与弹性。 3. 构建和优化 推理系统的可观测性能力,包括日志、指标、Tracing 以及基础成本与性能分析。 4. 针对 低延迟、高吞吐、高 GPU 利用率 等目标,参与系统性能优化与问题排查。 与算法、平台、硬件等团队协作,持续优化推理系统在性能、成本与稳定性上的整体表现。 5. 根据经验级别,逐步或直接承担 技术方案设计、系统演进决策、复盘与优化推动 等职责。 我们会根据候选人能力与经验,在具体职责深度和影响范围上进行匹配。

1. 负责商汤SenseCore AI智算数据中心以及大模型应用开发平台等产品的项目落地技术设计、开发工作; 2. 协同公司内外部产品团队、售前团队以及项目管理团队,做好需求管理,参与项目定制化开发工作,完成客户项目落地。

1.大模型应用开发:负麦基于主流开源/闭源大模型进行应用落地,包括问答系统、智能助手、知识检索、文档处理等;并与产品、前端、后端、数据团队紧密协作,推动算法模型在真实业务中的部署与落地。 2.RAG 系统优化:主导通用型 RAG(Retrieval-Augmented Generation)系统的构建与效果优化,包括召回、排序、长文本处理、多文档合成等关键环节。 3.模型效果调优:结合业务场景,设计 Prompt、微调、评测等策略,提升大模型在特定任务中的表现。 4.技术积累与分享:沉淀可复用的模型应用框架、调优经验和评估指标,推动团队整体技术能力提升。