logo of kuaishou

快手多模态大模型数据处理算法专家-【可灵大模型】

社招全职3-5年D4124地点:北京状态:招聘

任职要求


1、计算机、统计学、数学或相关专业硕士及以上学历,具备丰富的机器学习大模型训练及数据处理项目经验,拥有扎实的数据分析与建模基础;
2、熟练使用 PythonSQL 等分析工具,掌握常用数据分析与可视化工具(如 PandasTableauMatplotlib 等);
3、具备良好的沟通能力和团队合作精神,能够独立完成分析并提出可落地的优化建议;
4、加分项:对视频生成、计算机视觉或多模态生成技术有深入理解;对生成式 AI 领域有浓厚兴趣,关注行业动态并能提出创新性建议。

工作职责


1、数据特征算法方案制定与效果优化:针对不同模态、多种类目的数据,设计自动化筛选方案;对多模态数据涉及的前沿特征算法(如物体跟踪、ID 重识别、音频分离)进行场景化效果优化。与算法工程师协作,制定数据调整与扩展策略,提升模型在真实场景中的生成能力;
2、数据 pipeline 建设:负责多模态大模型训练数据的构建与管理,参与数据筛选、标注及质量评估工作。分析和挖掘现有数据资源,设计有效的数据分布策略,支持模型持续迭代;
3、数据分布分析:对模型训练数据分布进行详细分析,识别数据偏差、不均衡及潜在问题。提供可视化报告及改进建议,确保训练数据覆盖目标场景并满足多样性需求,最终通过数据驱动方法优化视频生成大模型效果。
包括英文材料
学历+
机器学习+
大模型+
数据分析+
Python+
SQL+
Pandas+
Tableau+
Matplotlib+
OpenCV+
相关职位

logo of kuaishou
社招3-5年D13338

1、主要负责可灵平台推荐/搜索等方向算法优化,帮助提升可灵平台用户留存、营收等核心指标; 2、参与大规模机器学习、深度学习领域技术研发工作,包括但不限于推荐算法、多模态、大模型SFT等算法研发; 3、参与搭建可灵平台实时在线学习推荐算法系统,快速处理海量用户数据,提升算法性能,满足高并发、高时效性和可靠稳定性; 4、和产品、运营等团队合作,共同优化可灵社区生态,提供给用户更好体验,满足用户视频内容生产与消费、社交互动等多方面需求。

更新于 2025-09-19
logo of kuaishou
社招5-10年D13338

1、主要负责可灵平台推荐/搜索/内容理解等方向算法优化,帮助提升可灵平台用户留存、营收等核心指标; 2、参与大规模机器学习、深度学习领域技术研发工作,包括但不限于多模态、大模型SFT等算法研发; 3、参与搭建可灵平台在线学习策略算法系统,快速处理海量用户数据,提升算法性能,满足高并发、高时效性和可靠稳定性; 4、和产品、运营等团队合作,共同优化可灵社区生态,提供给用户更好体验,满足用户视频内容生产与消费、社交互动等多维需求。

更新于 2025-09-30
logo of meituan
社招2年以上核心本地商业-美

构建和完善服体大模型语料库,例如通过撰写对话语料来完成对话及NLP任务,重点是产出与客户服务相关的高质量对话数据; 负责迭代和调优数据语料,提升对话数据的质量情况、流畅度和和互动性; 深入分析和研究客户服务与用户体验场景,确保对话内容的精准度和创造性; 跨部门团队协作,根据项目需求,完善对应标准和流程,完成特定数据的生产任务; 输出与带教,协助团队其他非技术向员工,提升该群体对大语言模型的了解程度、教授实际应用技巧等,以辅助团队更好完成业务目标 带领团队高效完成标注和内容生产项目同时负责管理标注团队,积极推动标注工具、组织流程及交付流程优化,提升并完善团队的交付能力

更新于 2025-06-22
logo of antgroup
社招2年以上技术类-算法

1、深入理解AI多模态大模型,支撑图像、音频、视频等模态的高质量训练语料构建;包括但不限于基础语料清洗、语料标签化、语料自动评价以及推理类语料合成。 2、构建基于多模态Agent的数据闭环系统,开发面向全模态的语料处理链路,提供稳定、可靠、高效的高质量数据处理能力与语料问题分析能力。 3、跟紧业界前沿大模型技术,复现优质语料合成算法与模型技术框架,支持数据消融与模型效果分析;保障语料交付的可持续性与先进性。

更新于 2025-06-18