快手（可灵AI专项）Data Infra 推理系统工程师

社招全职3-5年D28632025-09-18地点：北京状态：招聘

扫码手机上打开

任职要求

1、硕士及以上学历，计算机、软件工程、人工智能、自动化等相关专业；
2、3年以上机器学习系统或基础架构研发经验，熟练掌握 Python/C++ 语言中的一种；
3、熟悉至少一种大模型…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

参与多模态数据生产相关的模型推理系统研发工作，工作内容包括：
1、构建高可用、高吞吐的数据算法服务框架，支持多模态模型服务的高效部署和迭代；
2、通过各种技术手段持续优化性能，降低推理成本，包括但不限于：算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

机器学习+

Python+

C+++

还有更多 •••

登录查看完整学习资料

相关职位

（可灵AI专项）多模态 Data Infra 高级工程师

社招3-5年D2863

更新于 2025-09-18北京

多模态 Data Infra 高级工程师-【可灵AI专项】

社招3-5年J0011

1、对接视频/图片/音频等各类多模态模型的数据生产需求，打造业界领先的多模态数据生产引擎，持续提升训练数据的规模、质量和迭代效率，支撑可灵全系多模态生成模型训练； 2、搭建 Data Centric 的多模态数据处理 pipeline，包括数据处理算子开发、跨模态检索引擎开发、多模态数据的内容理解、质量筛选、组织与合成等关键环节； 3、构建高可用、高吞吐的数据算法服务框架，支持多模态模型服务的快速部署，通过各种技术手段持续优化性能，降低推理成本，包括但不限于：算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等； 4、设计并实现高可扩展、低成本的多模态数据存储架构，支持对象存储、文件系统及数据库技术的融合应用，参与多模态数据管理体系的建设，实现统一的元数据标准、数据编目、版本控制和生命周期管理； 5、构建跨模态数据关联与检索能力，支持基于内容的相似性搜索、标签检索和多模态联合查询； 6、跟踪业界前沿技术（如向量数据库、云原生存储、数据湖仓一体等），推动系统持续演进。

更新于 2026-04-09北京

AI平台高级研发工程师（大模型专项）

社招3年以上机器学习平台

【业务介绍】我们是小红书内稠密类模型（LLM/MLLM/SD/CV/NLP）统一的AI平台QuickSilver，负责调度公司内所有稠密类模型训练与推理资源，基于自建的训推引擎，为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务；包括数据管理，模型管理，模型训练、压缩、推理、部署，服务管理，资源调度等一系列能力。工作职责： 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程，包括模型fine-tuning、推理服务化等 3、构建云原生架构，设计高可用、高性能的微服务体系 4、优化平台性能，提升系统稳定性和可扩展性

北京|上海|深圳

AI平台高级研发工程师（训练方向）

社招3年以上机器学习平台

1、负责模型训练平台核心功能开发和架构设计，包括传统CN/NLP/SD/LLM等多场景支持 2、负责大模型后训练工具平台化建设，包括后预训练、微调、对齐等技术落地 3、设计和实现高性能分布式训练系统，打造端到端训练解决方案 4、优化训练调度和资源管理，提升集群利用率和训练效率 5、开发模型训练监控诊断工具，建设可观测性体系

北京|上海|深圳