logo of sensetime

商汤26届AI领航员-大装置-大模型推理优化工程师

校招全职技术开发类地点:北京 | 上海状态:招聘

任职要求


1.有扎实的计算机科学知识,熟练掌握Pytorch,具备良好的编程能力和代码风格
2.对A|大模型相关技术原理有较为完整的认识,熟悉vllm sglang tensorrt 等种大模型推理框架。
3…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.参与开发大模型推理框架,提升系统性能和系统稳定性。
2.对模型性能持续调优,包括不限于高性能算子加速库建设、并行策略开发
3.持续扩充核心框架的功能和计算能力,优化系统的架构和模型设计,保持一定的业务和技术前瞻性。
包括英文材料
PyTorch+
大模型+
vLLM+
还有更多 •••
相关职位

logo of sensetime
校招技术开发类

岗位可以选择训练框架开发/推理优化两个方向 训练框架: 1. 参与深度学习框架的代码实现,开发框架支持大模型训练、微调能力,提升系统件能和系统稳定性。 2. 持续扩充核心框架的功能和计算能力,优化系统的架构和模型设计,保持一定的业务和技术前瞻性。 3.与产品和测试以及其他研发团队深入协作,解决关键问题,完成研发计划。 4.负责大模型训练相关技术,方案及架构设计沟通、规划、撰写。 5.调研分析海内外产品技术实现,探索创新方向。 推理优化: 1. 参与开发大模型推理框架,提升系统性能和系统稳定性。 2. 持续扩充核心框架的功能和计算能力,优化系统的架构和模型设计,保持一定的业务和技术前瞻性。 3.与产品和测试以及其他研发团队深入协作,解决关键问题,完成研发计划。 4.负责大模型推理相关技术,方案及架构设计沟通、规划、撰写。 5.调研分析海内外产品技术实现,探索创新方向.

更新于 2025-11-03北京|上海
logo of sensetime
校招技术开发类

1. 参与MaaS平台的功能测试、接口测试、自动化测试体系建设; 2. 参与设计并实现模型推理、训练、评估等流程的自动化验证机制; 3. 参与搭建端到端测试框架,提升测试效率与覆盖率; 4. 与平台研发、算法、运维等团队紧密协作,推动产品质量持续提升; 5. 深度参与模型性能测试与混沌测试,评估系统在高负载与异常场景下的稳定性; 6. 支持 CI/CD 流水线集成测试脚本,保障版本交付质量。

更新于 2025-08-21杭州|上海
logo of sensetime
校招算法研究类

1.大模型应用开发:负麦基于主流开源/闭源大模型进行应用落地,包括问答系统、智能助手、知识检索、文档处理等;并与产品、前端、后端、数据团队紧密协作,推动算法模型在真实业务中的部署与落地。 2.RAG 系统优化:主导通用型 RAG(Retrieval-Augmented Generation)系统的构建与效果优化,包括召回、排序、长文本处理、多文档合成等关键环节。 3.Agent 框架开发:研究和实现多 Agent 协作框架,提高 Agent 在复杂任务中的稳定性与执行效果,探索如任务分解、工具使用、状态记忆等机制。 4.模型效果调优:结合业务场景,设计 Prompt、微调、评测等策略,提升大模型在特定任务中的表现。 5.技术积累与分享:沉淀可复用的模型应用框架、调优经验和评估指标,推动团队整体技术能力提升。

更新于 2025-11-03北京
logo of sensetime
校招技术开发类

1. 负责实现和迭代自然语言处理相关算法,支撑企业数字化业务中的自然语言理解和生成需求,例如信息抽取、文档分析、检索问答、对话交互等; 2. 深度参与客户工程业务实现,将算法和企业业务需求应用相配合,实现客户端到端业务需求,实现LLM的落地最后一公里; 3. 积极跟进LLM SOTA技术,能够迅速在某一细分领域的深入掌握最新算法,包括但不限于基础模型跟进、推理框架优化、SFT训练及Agent智能体开发; 4. 设计和开发基于大语言模型(LLM)的智能Agent,优化其在不同业务场景中的任务规划、工具调用及自主决策能力; 5. 培训非LLM专业人员,使之具备基本标准业务落地AI赋能能力。

更新于 2025-08-01北京