logo of kuaishou

快手服务端性能优化工程师-【大模型方向】

社招全职D4137地点:北京状态:招聘

任职要求


1、熟悉常用AI框架,熟悉计算机体系结构,有并行计算经验,能够深入了解GPU/CPU/NPU全链路相关的加速优化技术,包括且不限于SSE/AVX/Neon等指令优化和汇编优化、定点优化、低比特量化;
2、熟悉CNN、diffusion model、transformerAI模型的推理性能优化技术,熟悉编译优化技术及相关框架,有显存优化、算子融合、图优化等实操经验;
3、熟悉CUDA编程,具备较好开发能力,熟悉triton、cutlass、有算子库开发经验者优先;
4、熟悉音视频流媒体计算,有高并发低延时系统落地经验者优先;
5、具有良好的团队合作精神和沟通能力,能够对算法和底层的协同优化起到核心桥梁作用。

工作职责


参与数字人直播/智能体互动的AI推理和高性能计算调度架构的设计,参与AIGC diffuision加速,以及流媒体高性能优化等关键技术研究及核心代码开发,更好的服务数字人AIGC业务。
包括英文材料
CUDA+
高并发+
算法+
相关职位

logo of tencent
社招2年以上微信技术

随着视频号业务发展以及大模型 AI 能力的突破,视频号业务与大模型结合努力尝试,希望在视频创作等场景进行结合落地。为了保证需求快速高质量的迭代,希望邀请热爱技术的你,一起攻克这些难题。 1.为推荐场景提供高性能的可靠特征计算能力; 2.对模型服务性能做极致优化,保证需求的快速迭代和高质量稳定运行; 3.结合业务场景对模型进行管理调度以及针对性优化,提升业务的稳定性; 4.完成内部AI应用研效工具建设,帮助产品迅速落地想法,提升迭代效率。

更新于 2025-06-10
logo of tencent
社招3年以上视频号短视频技术

随着视频号业务发展以及大模型 AI 能力的突破,视频号业务与大模型结合努力尝试,希望在视频创作等场景进行结合落地。为了保证需求快速高质量的迭代,希望邀请热爱技术的你,一起攻克这些难题。 1.为推荐场景提供高性能的可靠特征计算能力; 2.对模型服务性能做极致优化,保证需求的快速迭代和高质量稳定运行; 3.结合业务场景对模型进行管理调度以及针对性优化,提升业务的稳定性; 4.完成内部AI应用研效工具建设,帮助产品迅速落地想法,提升迭代效率。

更新于 2025-09-01
logo of mi
社招5年以上A18742

1. 主导大模型系统架构设计: 负责RAG系统的整体架构设计,包括存储层、检索层、推理层与缓存层的技术选型与实现。 构建高可用、低延迟的分布式推理服务框架,支持向量数据库集成(如Milvus、Elastic)、知识库管理与多模态检索优化。 设计并实现Agent工作流编排框架,支持工具调用(MCP协议)、任务规划与自动化执行。 2.模型部署与性能优化: 负责大模型(LLM/VLM)的本地化部署、量化压缩、动态批处理与推理加速,优化GPU/CPU异构算力利用率。 3. AI服务平台开发: 基于Java/Go/Python构建高并发、可扩展的AI微服务,与现有业务系统深度集成,实现模型训练-部署-监控的全链路管理。 4.技术领导与跨团队协作: 指导中级工程师,制定技术方案,并主导技术攻关。与产品、算法、基础设施团队协作,定义需求并推动工程落地。

更新于 2025-09-19
logo of baidu
社招TPG

-负责视觉工程研发和业务交付,研发 AI 模型推理、图声处理、媒体流等工作 -负责视觉工程研发服务端开发、前/终端开发等,具体因候选人而异,按需调整方向 -负责工程性能优化、异构硬件芯片适配、协同交付测试系统联调,确保产出质量 -负责视觉感知类业务(诸如识别、检测等)、AIGC 与生成类业务、数字人业务等 -负责面向业务交付充分保障需求研发质量、面向工程服务稳定重复保证服务高效运行

更新于 2024-08-09