logo of kuaishou

快手【快Star-X】多模态理解工程师-视觉生成

校招全职J1007地点:北京状态:招聘

任职要求


1、硕士及以上学历,有LLM和VLM大模型训练经验;有较强的代码动手开发能力,对多模态大模型基座能力提升有较高的热情;
2、良好的沟通协作能力,能够与团队紧密合作,共同推进项目进展。

加分项:
1、在ACM/ICPC、Top Coder、Kaggle等比赛中取得过良好成绩是加分项;
2、在大模型领域,发表过相关论文是加分项;
3、多模态大模型的项目经历和实习经历是加分项。

工作职责


深度优化多模态大模型的Caption、表征、改写能力,打造业界第一梯队的多模态大模型,在AIGC技术指标上超过GPT-4o、Gemini Pro等闭源模型,落地于快手各业务线。
包括英文材料
学历+
大模型+
Kaggle+
相关职位

logo of kuaishou
校招J1007

1、对图像、视频、文本等进行深入的语义理解,支持短视频、直播、风控、搜索、推荐、商业化等业务需求; 2、推进视觉相关基础技术研发,如大规模分类、检测、分割、序列识别、人脸、自监督学习、内容生成、模型压缩和优化等。

更新于 2025-07-26
logo of kuaishou
校招J1007

1、负责研发业界领先的多模态理解与生成统一架构,从事基础模型预训练、监督微调、架构优化等,重点探索感知(理解)与生成能力的协同演进与边界突破; 2、研究高效建模多模态数据(图像、文本、视频等)的新范式,提升模型的信息表征、理解与联合生成能力; 3、探索并研发更高效的视觉编码器,构建更强大的多模态模型基础; 4、发表高水平学术论文和开源项目,提升团队在学术界、工业界的技术影响力。

更新于 2025-06-26
logo of kuaishou
实习J1007

1、对图像、视频、文本等进行深入的语义理解,支持短视频、直播、风控、搜索、推荐、商业化等业务需求; 2、推进视觉相关基础技术研发,如大规模分类、检测、分割、序列识别、人脸、自监督学习、内容生成、模型压缩和优化等。

更新于 2025-05-14
logo of kuaishou
实习J1001

1、数据特征算法方案制定与效果优化:针对不同模态、多种类目的数据,设计自动化筛选方案;对多模态数据涉及的前沿特征算法(如物体跟踪、ID 重识别、音频分离)进行场景化效果优化。与算法工程师协作,制定数据调整与扩展策略,提升模型在真实场景中的生成能力; 2、数据 pipeline 建设:负责多模态大模型训练数据的构建与管理,参与数据筛选、标注及质量评估工作。分析和挖掘现有数据资源,设计有效的数据分布策略,支持模型持续迭代; 3、数据分布分析:对模型训练数据分布进行详细分析,识别数据偏差、不均衡及潜在问题。提供可视化报告及改进建议,确保训练数据覆盖目标场景并满足多样性需求,最终通过数据驱动方法优化视频生成大模型效果。

更新于 2025-07-18