快手多模态大模型数据算法专家（Keye）

社招全职3-5年J00112026-06-22地点：北京状态：招聘

扫码手机上打开

任职要求

1、在深度学习、多模态大模型、视频内容理解等领域有深入理解；
2、熟悉深度学习框架（如PyTorch），在模型训练、压缩和微调方面有丰富实践经验；
3、掌握OCR文字检测与识别、多模态内容理解大模型、多模态相似检索和聚类等算法；
4、具备丰富的大规模视频理解系统的架构设计及开发经验，熟悉Python微服务开发，熟悉TensorRT、vllm等推理优化技术；
5、具备可视化…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、大规模多模态数据理解：负责海量多模态数据的打标分类、语义分割、检测、OCR文字识别、Caption生成等工作，提升数据的可用性与质量；
2、数据 pipeline 建设：负责多模态大模型训练数据的构建与管理，参与数据筛选、标注及质量评估工作。分析和挖掘现有数据资源，设计有效的数据分布策略，并设计数据飞轮闭环，将用户交互数据反哺模型迭代；
3、制订长期规划：制定并实施大模型数据建设的长期发展规划，持续推动技术迭代与业务应用场景的拓展。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

深度学习+

大模型+

PyTorch+

OCR+

算法+

系统设计+

Python+

还有更多 •••

登录查看完整学习资料

相关职位

多模态大模型数据处理算法专家-【可灵大模型】

社招3-5年J0011

1、数据特征算法方案制定与效果优化：针对不同模态、多种类目的数据，设计自动化筛选方案；对多模态数据涉及的前沿特征算法（如物体跟踪、ID 重识别、音频分离）进行场景化效果优化。与算法工程师协作，制定数据调整与扩展策略，提升模型在真实场景中的生成能力； 2、数据 pipeline 建设：负责多模态大模型训练数据的构建与管理，参与数据筛选、标注及质量评估工作。分析和挖掘现有数据资源，设计有效的数据分布策略，支持模型持续迭代； 3、数据分布分析：对模型训练数据分布进行详细分析，识别数据偏差、不均衡及潜在问题。提供可视化报告及改进建议，确保训练数据覆盖目标场景并满足多样性需求，最终通过数据驱动方法优化视频生成大模型效果。

更新于 2026-06-09北京

多模态大模型数据处理算法工程师 —【可灵团队】

社招3-5年J0011

更新于 2026-06-09北京

多模态大模型算法实习生-【可灵AI-数据效能研究方向】

实习D14604

1、数据效能研究（Data Efficiency）：基于多模态大模型训练过程，分析不同模态数据的有效性、信息增益与贡献度；参与数据选择、数据蒸馏、难例挖掘等前沿技术探索，提升训练效率与模型表现； 2、数据–模型协同设计（Co-Design）：与模型团队协作，从训练曲线、梯度信号与分布特征中反推数据质量，研究分阶段（预训练/SFT/对齐）数据策略，设计高效的数据结构与采样机制； 3、高质量数据构建（Data Quality Engineering）：参与多模态数据 pipeline，包括自动标注、Caption 生成、数据去噪与一致性检查；探索弱监督、合成数据与模型 in-the-loop 的高质量数据生产方式； 4、多模态数据分析（Multimodal Analytics）：对训练数据进行覆盖度、偏差与难度分析，构建可视化与指标体系，为模型能力诊断与数据重构提供依据。

更新于 2025-12-10北京

多模态大模型算法工程师-【可灵AI-数据效能研究方向】

社招3-5年J0011

更新于 2026-06-09北京|深圳