logo of sensetime

商汤大装置-大模型算法开发高级工程师

社招全职算法工程地点:北京状态:招聘

任职要求


1. 熟练掌握C++Python等编程语言的一种或多种,具备良好的编码能力。
2. 有大型工程项目经验,代码风格严谨高效。
3. 熟悉多线程/多进程开发,拥有扎实的计算机体系结构、计算机网络、数据结构基础。
4. 熟悉开源开发工具https://github.com/LazyAGI/LazyLLM(可提前了解)

加分项
1. 熟练掌握深度学习框架Pytorch,熟悉colossal-AI, deepspeed, internEvo, megaton等任意一种分布式训练框架,熟悉至少一个微调框架(如alpaca-lora、easyllm等)和和推理框架(如vllm、lightllm、lmdeploy等)。
2. 拥有Web全栈开发经验,熟悉Flask/Djangoweb框架及React/Vue等主流前端框架,有大型C端应用开发经验,熟悉微服务架构。
3. 有大型c++项目开发经验,熟练掌握并行计算(OpenMp/Cuda等)程序开发,了解常用的深度学习算子优先。

工作职责


开发https://github.com/LazyAGI/LazyLLM
【注意】此岗位对编程要求较高,面试前欢迎先了解项目,会展开交流。

1. 结合业务落地的经验,探索并形成各个垂直领域应用定制开发的标准作业程序(SOP),沉淀到LazyLLM中
2. 打造灵活高效的场景应用建设方案,搭建从数据到训练、微调、部署、推理、评测、交付的低代码大模型应用生产SDK。
3. 与公司内外的行业伙伴合作,打造端到端解决方案能力,探索如一体机、私有化应用开发平台、国产芯片等业务交付新形态。
包括英文材料
C+++
Python+
多线程+
数据结构+
GitHub+
深度学习+
PyTorch+
DeepSpeed+
vLLM+
LMDeploy+
Web+
Flask+
Django+
React+
Vue+
微服务+
CUDA+
相关职位

logo of sensetime
社招5年以上后端开发

1. 负责商汤SenseCore AI智算数据中心以及大模型应用开发平台等产品的项目落地技术设计、开发工作; 2. 协同公司内外部产品团队、售前团队以及项目管理团队,做好需求管理,参与项目定制化开发工作,完成客户项目落地。

更新于 2025-09-03
logo of sensetime
校招算法研究类

1.大模型应用开发:负麦基于主流开源/闭源大模型进行应用落地,包括问答系统、智能助手、知识检索、文档处理等;并与产品、前端、后端、数据团队紧密协作,推动算法模型在真实业务中的部署与落地。 2.RAG 系统优化:主导通用型 RAG(Retrieval-Augmented Generation)系统的构建与效果优化,包括召回、排序、长文本处理、多文档合成等关键环节。 3.Agent 框架开发:研究和实现多 Agent 协作框架,提高 Agent 在复杂任务中的稳定性与执行效果,探索如任务分解、工具使用、状态记忆等机制。 4.模型效果调优:结合业务场景,设计 Prompt、微调、评测等策略,提升大模型在特定任务中的表现。 5.技术积累与分享:沉淀可复用的模型应用框架、调优经验和评估指标,推动团队整体技术能力提升。

更新于 2025-07-28
logo of sensetime
社招算法工程

1.大模型应用开发:负麦基于主流开源/闭源大模型进行应用落地,包括问答系统、智能助手、知识检索、文档处理等;并与产品、前端、后端、数据团队紧密协作,推动算法模型在真实业务中的部署与落地。 2.RAG 系统优化:主导通用型 RAG(Retrieval-Augmented Generation)系统的构建与效果优化,包括召回、排序、长文本处理、多文档合成等关键环节。 3.模型效果调优:结合业务场景,设计 Prompt、微调、评测等策略,提升大模型在特定任务中的表现。 4.技术积累与分享:沉淀可复用的模型应用框架、调优经验和评估指标,推动团队整体技术能力提升。

更新于 2025-08-19
logo of sensetime
实习技术族-实习

利用商汤自研的AI应用开发者工具LazyLLM(https://github.com/LazyAGI/LazyLLM),探索AI-Agent的可能性和商业化落地场景,包含但不限于多模态RAG、AI-PPT、AI小说、旅行助手等;

更新于 2025-04-21