logo of sensetime

商汤26届AI领航员-大装置-大模型推理优化工程师

校招全职技术开发类地点:北京 | 上海状态:招聘

任职要求


1.有扎实的计算机科学知识,熟练掌握Pytorch,具备良好的编程能力和代码风格
2.对A|大模型相关技术原理有较为完整的认识,熟悉vllm sglang tensorrt 等种大模型推理框架。
3.工作态度认真,做事主动、仔细。有强烈的责任心、有自驱力、抗压能力。
加分项:
1.熟悉NV以及国产化AI芯片技术,有推理性能优化经验
2.高性能算子kernal开发经验,cudaC++开发能力。

工作职责


1.参与开发大模型推理框架,提升系统性能和系统稳定性。
2.对模型性能持续调优,包括不限于高性能算子加速库建设、并行策略开发
3.持续扩充核心框架的功能和计算能力,优化系统的架构和模型设计,保持一定的业务和技术前瞻性。
包括英文材料
PyTorch+
大模型+
vLLM+
SGLang+
TensorRT+
CUDA+
C+++
相关职位

logo of sensetime
校招技术开发类

1. 参与MaaS平台的功能测试、接口测试、自动化测试体系建设; 2. 参与设计并实现模型推理、训练、评估等流程的自动化验证机制; 3. 参与搭建端到端测试框架,提升测试效率与覆盖率; 4. 与平台研发、算法、运维等团队紧密协作,推动产品质量持续提升; 5. 深度参与模型性能测试与混沌测试,评估系统在高负载与异常场景下的稳定性; 6. 支持 CI/CD 流水线集成测试脚本,保障版本交付质量。

更新于 2025-08-21
logo of sensetime
校招算法研究类

1.大模型应用开发:负麦基于主流开源/闭源大模型进行应用落地,包括问答系统、智能助手、知识检索、文档处理等;并与产品、前端、后端、数据团队紧密协作,推动算法模型在真实业务中的部署与落地。 2.RAG 系统优化:主导通用型 RAG(Retrieval-Augmented Generation)系统的构建与效果优化,包括召回、排序、长文本处理、多文档合成等关键环节。 3.Agent 框架开发:研究和实现多 Agent 协作框架,提高 Agent 在复杂任务中的稳定性与执行效果,探索如任务分解、工具使用、状态记忆等机制。 4.模型效果调优:结合业务场景,设计 Prompt、微调、评测等策略,提升大模型在特定任务中的表现。 5.技术积累与分享:沉淀可复用的模型应用框架、调优经验和评估指标,推动团队整体技术能力提升。

更新于 2025-07-28
logo of sensetime
校招技术开发类

1. 参与商汤自主研发的深度学习框架的研发与优化。工作目标是优化大数据工业级应用条件下的深度学习核心架构。 2. 适配深度学习算法与架构,对框架进行调整、改进和优化。 3. 对框架的训练速度进行优化,包括计算和通信及其调度,以提高模型训练的效率。 4. 扩充深度学习框架的功能和计算能力,完善工具体系。 5. 开发框架支持大模型推理、微调、训练的能力。

更新于 2025-08-21
logo of sensetime
校招技术开发类

1. 负责实现和迭代自然语言处理相关算法,支撑企业数字化业务中的自然语言理解和生成需求,例如信息抽取、文档分析、检索问答、对话交互等; 2. 深度参与客户工程业务实现,将算法和企业业务需求应用相配合,实现客户端到端业务需求,实现LLM的落地最后一公里; 3. 积极跟进LLM SOTA技术,能够迅速在某一细分领域的深入掌握最新算法,包括但不限于基础模型跟进、推理框架优化、SFT训练及Agent智能体开发; 4. 设计和开发基于大语言模型(LLM)的智能Agent,优化其在不同业务场景中的任务规划、工具调用及自主决策能力; 5. 培训非LLM专业人员,使之具备基本标准业务落地AI赋能能力。

更新于 2025-08-01