logo of sensetime

商汤26届AI领航员-研究院-大模型算法研究员(模型压缩)

校招全职算法研究地点:北京 | 上海 | 深圳状态:招聘

任职要求


1. 熟悉模型压缩算法、包括模型量化、剪枝等,熟练掌握PythonC++git、pytorch等工具;
2. 熟悉目前主流的AIGC模型及结构,熟悉常见的模型量化技术,并能够进行模型的实际场景和硬件平台进行针对性的量化优化;
3. 了解TensorRT-LLM、VLLM…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责模型压缩算法的研发和实现,包括但不限于模型量化、剪枝、蒸馏等;
2. 负责业务模型在多种场景及对应各异的芯片上的压缩精度提升和保持,包括AIGC(LLM / Stable Diffusion)模型,自动驾驶模型、手机端侧模型等;
3. 负责开发和维护LLM量化部署工具链,调研、复现业界最新的算法,集成工具,并在实际业务中落地, 助力大模型在各个产品线中的应用;
4. 通过分析模型与部署硬件特点,使用软硬结合的优化方案提升模型的速度与精度表现,提升模型压缩能力上限。
包括英文材料
算法+
Python+
C+++
Git+
还有更多 •••
相关职位

logo of didi
社招2-5年技术

1. 负责滴滴代驾乘客端App、小程序,司机端App,以及运营和营销平台等系统的研发工作; 2. 与产品、设计沟通,并能够针对不同业务需求给出前端技术解决方案; 3. 深度参与App和小程序的性能优化、稳定性保障、架构升级,以及组件化建设等相关工作,提升软件体验和研发效率;

更新于 2025-04-01杭州
logo of netease
实习网易云音乐

1、负责云音乐AI基建平台相关业务相关服务端开发; 2、负责业务AI相关落地; 3、根据产品需求完成服务器端设计、开发以及文档编写等工作; 4、优化系统性能, 改善系统的稳定性及易用性,提升用户体验。

更新于 2025-08-12杭州
logo of netease
实习网易游戏(雷火)

1.与编剧团队合作,共同细化和丰富游戏故事和世界观。 2.基于核心叙事设定和剧本,与关卡、玩法、美术部门密切沟通和合作,设计并协助实现关卡内的叙事内容。 3.规划和跟进叙事内容所需资产的制作和表现,实现高质量的in-game叙事体验。 4.与程序、技术策划合作,协助设计和完善叙事落地的相关工具。

更新于 2025-06-21杭州
logo of aliyun
社招诚云科技

1、负责资产管理流程的落地、推进问题处理; 2、负责对资产管理员的管理,识别人员和资产风险,制定解决方案; 3、负责所辖机房的资产指标达成; 4、跟进所辖机房的资产到货、入库、盘点、上架、下架、报废处置等全部流程; 5、按照管理要求执行其他资产处置工作。

更新于 2026-01-26乌兰察布|嘉兴|中卫