logo of tencent

腾讯微信-高性能 - 视觉 AIGC 大模型推理优化工程师

社招全职1年以上视频号短视频技术地点:深圳状态:招聘

任职要求


1. 对 CPU/GPU/NPU 等硬件体系结构有实践层面的理解,将其落地于算子性能与模型部署优化中
2. 对当前常见的开源 AIGC 模型和框架,如 HunyuanVideo、Wan、LTX、ComfyUI 等,有推理调优经验
3. 熟悉 Linux 系统与分布式环境部署调试,熟悉 Python 开发
4. 具有良好的沟通能力,能够与算法侧、业务侧顺畅协作
5. 愿意探索和尝试新技术,对 AI 落地应用与提效有热情与愿景

加分项
1. 有国产 GPU / …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 针对 NPU、GPU 等异构硬件,探索 AIGC 大模型的最优推理方案,开发维护自研 AIGC 推理框架,将 XNet 推理引擎的优化能力赋能业务模型,支持微信视频号及其他业务的部署与持续优化
2. 深入理解 AIGC 大模型,以算法-系统 Co-design 的思路,探索与应用 Cache、稀疏、量化等 Training-free 或需要 Finetune 的优化方案,在保证业务指标的前提下,探索推理优化的边界
3. 持续跟进 AIGC 大模型的发展动态,探索并落地通用推理优化方案,支持新模型的高效上线,并提供模型优化的原子能力,支持算法侧与业务侧的高效接入与调试
包括英文材料
AIGC+
Linux+
Python+
算法+
大模型+
还有更多 •••