logo of kuaishou

快手(可灵AI专项)多模态 Data Infra 高级工程师

社招全职3-5年D2863地点:北京状态:招聘

任职要求


1、硕士及以上学历,计算机、软件工程、人工智能、自动化等相关专业;
2、3年以上数据工程系统或者基础架构研发经验,熟练掌握Java/C++/Python语言中的一种;
3、熟悉海量大规模数据处理技术,如RaySpark、Fink等;
4、具备分布式系统的研发经验,有优化系统性能问题的能力和经验;
5、有以下经验者优先:
1)有多模态数据处理或多模态模型部署相关经验;
2)熟悉某种大模型推理或训练框架(如vLLMSGLangPyTorch);
3)具备异构GPU上的推理部署和推理优化经验;

工作职责


1、对接视频/图片/音频等各类多模态模型的数据生产需求,打造业界领先的多模态数据生产引擎,持续提升训练数据的规模、质量和迭代效率,支撑可灵全系多模态生成模型训练;
2、搭建 Data Centric 的多模态数据处理 pipeline,包括数据处理算子开发、跨模态检索引擎开发、多模态数据的内容理解、质量筛选、组织与合成等关键环节;
3、构建高可用、高吞吐的数据算法服务框架,支持多模态模型服务的快速部署,持续优化多模态数据的存储以及检索效率。
包括英文材料
学历+
Java+
C+++
Python+
Ray+
Spark+
分布式系统+
大模型+
vLLM+
SGLang+
PyTorch+
相关职位

logo of kuaishou
实习D2863

1、对接视频/图片/音频等各类多模态模型的数据生产需求,打造业界领先的多模态数据生产引擎,持续提升训练数据的规模、质量和迭代效率,支撑可灵全系多模态生成模型训练; 2、搭建 Data Centric 的多模态数据处理 pipeline,包括数据处理算子开发、跨模态检索引擎开发、多模态数据的内容理解、质量筛选、组织与合成等关键环节; 3、构建高可用、高吞吐的数据算法服务框架,支持多模态模型服务的快速部署,持续优化多模态数据的存储以及检索效率。

更新于 2025-09-18
logo of kuaishou
社招3-5年D2863

参与多模态数据生产相关的模型推理系统研发工作,工作内容包括: 1、构建高可用、高吞吐的数据算法服务框架,支持多模态模型服务的高效部署和迭代; 2、通过各种技术手段持续优化性能,降低推理成本,包括但不限于:算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等。

更新于 2025-09-18
logo of kuaishou
社招3-5年D4124

1、大规模视频理解:负责可灵海量视频数据的打标分类、语义分割、文字识别、Caption生成、聚类分析等工作; 2、模型开发与优化:基于CNN、VLM等技术推进模型训练、微调、评测及高效部署,推动模型在实际场景中的大规模应用; 3、技术研究与创新:聚焦多模态视频生成领域前沿课题,探索生成模型的数据采样技术,提升生成模型的数据使用效率和语义响应能力,打造在业界的领先技术优势; 4、跨领域协作:参与跨团队跨部门技术协同,推动Human in the loop在视频生成领域的研究落地。

更新于 2025-08-04
logo of kuaishou
社招3年以上D4124

1、大规模视频理解:负责可灵海量视频数据的打标分类、语义分割、文字识别、Caption生成、聚类分析等工作; 2、模型开发与优化:基于CNN、VLM等技术推进模型训练、微调、评测及高效部署,推动模型在实际场景中的大规模应用; 3、技术研究与创新:聚焦多模态视频生成领域前沿课题,探索生成模型的数据采样技术,提升生成模型的数据使用效率和语义响应能力,打造在业界的领先技术优势; 4、跨领域协作:参与跨团队跨部门技术协同,推动Human in the loop在视频生成领域的研究落地。

更新于 2025-07-15