通义通义实验室-多模态大模型数据处理工程师-通义百聆

社招全职3年以上技术类-开发2026-03-25地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1、熟练掌握数据处理工具（SQL/maxcompute/spark/UDF等），有数据标注、清洗、评估等实战经验。
2、熟悉数据仓库架构，数据仓库建模和ETL流程，在数据治理上有一定实战经验。
3、掌握Python及主流数据处理工具库，理解数据清洗技术；熟悉数…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责多模态数据数据pipeline建设、数据版本管理、数据处理、数据算子开发集成等工作。
2、开发自动化数据处理工具与脚本，优化数据清洗、标注及质量评估的效率和规模化能力。
3、参与多模态大模型训练数据的构建与管理，参与数据筛选、标注及质量评估工作。分析和挖掘现有数据资源，设计有效的数据分布策略，支持模型持续迭代；
4、与算法团队紧密协作，根据模型训练需求定制数据策略，提升训练效果。
5、参与模型推理与部署、模型蒸馏、推理服务服务化，能够支持tagging及服务优化工作。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

SQL+

Spark+

数据仓库+

还有更多 •••

登录查看完整学习资料

相关职位

多模态大模型数据处理算法工程师 —【可灵团队】

社招3-5年J0011

1、数据特征算法方案制定与效果优化：针对不同模态、多种类目的数据，设计自动化筛选方案；对多模态数据涉及的前沿特征算法（如物体跟踪、ID 重识别、音频分离）进行场景化效果优化。与算法工程师协作，制定数据调整与扩展策略，提升模型在真实场景中的生成能力； 2、数据 pipeline 建设：负责多模态大模型训练数据的构建与管理，参与数据筛选、标注及质量评估工作。分析和挖掘现有数据资源，设计有效的数据分布策略，支持模型持续迭代； 3、数据分布分析：对模型训练数据分布进行详细分析，识别数据偏差、不均衡及潜在问题。提供可视化报告及改进建议，确保训练数据覆盖目标场景并满足多样性需求，最终通过数据驱动方法优化视频生成大模型效果。

更新于 2026-06-09北京

多模态大模型数据处理算法专家-【可灵大模型】

社招3-5年J0011

更新于 2026-06-09北京

多模态大模型数据算法专家（Keye）

社招3-5年J0011

1、大规模多模态数据理解：负责海量多模态数据的打标分类、语义分割、检测、OCR文字识别、Caption生成等工作，提升数据的可用性与质量； 2、数据 pipeline 建设：负责多模态大模型训练数据的构建与管理，参与数据筛选、标注及质量评估工作。分析和挖掘现有数据资源，设计有效的数据分布策略，并设计数据飞轮闭环，将用户交互数据反哺模型迭代； 3、制订长期规划：制定并实施大模型数据建设的长期发展规划，持续推动技术迭代与业务应用场景的拓展。

更新于 2026-06-22北京

多模态大模型数据策略Leader-大模型数据服务中心

社招A168028

1、深度参与多模态大模型前沿方向的数据工作，重点负责视频/图像生成模型及AI多模型产品的效果评估，以及多模态大模型训练数据策略及标注管理； 2、负责多模态数据任务的理解与拆解，基于图像/视频内容特征及业务目标，制定对应的数据规则与质量体系； 3、建设科学的多模态大模型评测方案与策略，确保评估体系能够准确反映模型问题与能力变化，助力模型效果达到业内一流； 4、深入理解业务场景、市场动态和大模型技术趋势，牵引数据团队和算法团队的深度融合。

更新于 2025-12-15北京