快手服务端性能优化工程师-【大模型方向】

社招全职D41372025-06-20地点：北京状态：招聘

扫码手机上打开

任职要求

1、熟悉常用AI框架，熟悉计算机体系结构，有并行计算经验，能够深入了解GPU/CPU/NPU全链路相关的加速优化技术，包括且不限于SSE/AVX/Neon等指令优化和汇编优化、定点优化、低比特量化；
2、熟悉CNN、diffusion model、transformerAI模型的推理性能优化技术，熟悉编译…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

参与数字人直播/智能体互动的AI推理和高性能计算调度架构的设计，参与AIGC diffuision加速，以及流媒体高性能优化等关键技术研究及核心代码开发，更好的服务数字人AIGC业务。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

CUDA+

还有更多 •••

登录查看完整学习资料

相关职位

微信视频号-后台开发高级工程师（大模型技术方向）

社招2年以上微信技术

随着视频号业务发展以及大模型 AI 能力的突破，视频号业务与大模型结合努力尝试，希望在视频创作等场景进行结合落地。为了保证需求快速高质量的迭代，希望邀请热爱技术的你，一起攻克这些难题。 1.为推荐场景提供高性能的可靠特征计算能力； 2.对模型服务性能做极致优化，保证需求的快速迭代和高质量稳定运行； 3.结合业务场景对模型进行管理调度以及针对性优化，提升业务的稳定性； 4.完成内部AI应用研效工具建设，帮助产品迅速落地想法，提升迭代效率。

更新于 2025-06-10广州

微信视频号-后台开发高级工程师（大模型技术方向）

社招3年以上视频号短视频技术

更新于 2025-09-01广州

高级AI系统开发工程师（大模型与RAG方向）

社招5年以上A18742

1. 主导大模型系统架构设计：负责RAG系统的整体架构设计，包括存储层、检索层、推理层与缓存层的技术选型与实现。构建高可用、低延迟的分布式推理服务框架，支持向量数据库集成（如Milvus、Elastic）、知识库管理与多模态检索优化。设计并实现Agent工作流编排框架，支持工具调用（MCP协议）、任务规划与自动化执行。 2.模型部署与性能优化：负责大模型（LLM/VLM）的本地化部署、量化压缩、动态批处理与推理加速，优化GPU/CPU异构算力利用率。 3. AI服务平台开发：基于Java/Go/Python构建高并发、可扩展的AI微服务，与现有业务系统深度集成，实现模型训练-部署-监控的全链路管理。 4.技术领导与跨团队协作：指导中级工程师，制定技术方案，并主导技术攻关。与产品、算法、基础设施团队协作，定义需求并推动工程落地。

更新于 2025-09-19武汉

视觉工程研发工程师（大模型/AIGC/生成/感知）（J69800）

社招TPG

-负责视觉工程研发和业务交付，研发 AI 模型推理、图声处理、媒体流等工作 -负责视觉工程研发服务端开发、前/终端开发等，具体因候选人而异，按需调整方向 -负责工程性能优化、异构硬件芯片适配、协同交付测试系统联调，确保产出质量 -负责视觉感知类业务（诸如识别、检测等）、AIGC 与生成类业务、数字人业务等 -负责面向业务交付充分保障需求研发质量、面向工程服务稳定重复保证服务高效运行

更新于 2024-08-09北京