logo of kuaishou

快手多模态大模型算法实习生-【可灵AI-数据效能研究方向】

实习兼职D14604地点:北京状态:招聘

任职要求


1、具有计算机、人工智能、统计学等相关专业硕士及以上背景,理解深度学习与多模态模型基本原理;
2、熟练掌握 Python/PyTorch,具备扎实的数据分析能力,对模型训练数据的分布、质量与信号敏感度有较强理解力;
3、对数据效能、数据选择、数据蒸馏、合成数据、self-supervised 等方向有浓…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、数据效能研究(Data Efficiency):基于多模态大模型训练过程,分析不同模态数据的有效性、信息增益与贡献度;参与数据选择、数据蒸馏、难例挖掘等前沿技术探索,提升训练效率与模型表现;
2、数据–模型协同设计(Co-Design):与模型团队协作,从训练曲线、梯度信号与分布特征中反推数据质量,研究分阶段(预训练/SFT/对齐)数据策略,设计高效的数据结构与采样机制;
3、高质量数据构建(Data Quality Engineering):参与多模态数据 pipeline,包括自动标注、Caption 生成、数据去噪与一致性检查;探索弱监督、合成数据与模型 in-the-loop 的高质量数据生产方式;
4、多模态数据分析(Multimodal Analytics):对训练数据进行覆盖度、偏差与难度分析,构建可视化与指标体系,为模型能力诊断与数据重构提供依据。
包括英文材料
深度学习+
Python+
还有更多 •••
相关职位

logo of kuaishou
实习D2863

1、对接视频/图片/音频等各类多模态模型的数据生产需求,打造业界领先的多模态数据生产引擎,持续提升训练数据的规模、质量和迭代效率,支撑可灵全系多模态生成模型训练; 2、搭建 Data Centric 的多模态数据处理 pipeline,包括数据处理算子开发、跨模态检索引擎开发、多模态数据的内容理解、质量筛选、组织与合成等关键环节; 3、构建高可用、高吞吐的数据算法服务框架,支持多模态模型服务的快速部署,持续优化多模态数据的存储以及检索效率。

更新于 2025-09-18北京
logo of kuaishou
实习D10702

随本地生活业务多场景AI落地,构建AIGC、B/C端等智能服务的数据飞轮,主要工作涉及: 1. 用户数据分析和策略制定:分析用户交互数据和转化数据,评估不同商品和不同视频内容下用户的转化情况,制定选品、价格和内容优化策略; 2. 优化模型生成效果:负责模型训练数据构建与管理,参与数据筛选、标注及评测体系构建工作。分析和挖掘现有数据资源,通过数据驱动的方法优化,结合A/B测试等手段验证调整效果。

更新于 2025-09-01北京
logo of kuaishou
实习D11544

随用户增长业务多场景AI落地,需要具备AI能力的人才加入工程团队,为业务贡献指标,主要工作涉及: 1、分享物料AI优化:通过对分享文案、图片等物料进行AI生成,持续优化分享回流效果;建立打分模型、评测模型等AI基建; 2、优化模型生成效果:负责模型训练数据构建与管理,参与数据筛选、标注及评测体系构建工作。分析和挖掘现有数据资源,通过数据驱动的方法优化,结合A/B测试等手段验证调整效果。

更新于 2025-07-29北京
logo of kuaishou
实习J1020

1、基于快手自研的文生视频(可灵)、文生图(可图)、文生文(快意)等大语言模型和多模态模型,研发包含多媒体素材AIGC自动化创作系统与工具平台和 Chatbot、VideoCaption、VQA 等各类形态的工业级 AI Agent 系统,并应用于快手生态的内容生产与消费、内容理解与素材挖掘等各类业务场景; 2、参与研发AIGC、AI Agent等系统所依赖的关键子系统,并于算法团队合作持续迭代AIGC的内容质量与效果、AI Agent的智能化效果; 3、跟踪业界AIGC、AI Agent等内容成产、智能体的前沿进展,并将最新的大模型技术能力引入到实际业务场景中。

更新于 2025-05-14北京