logo of kuaishou

快手多模态大模型后训练算法专家​-【Keye】

社招全职J0011地点:北京状态:招聘

任职要求


1、​​硕士及以上学历,计算机科学、人工智能、自动化、数学等相关专业优先;
2、精通多模态任务设计范式(如视觉思维链、跨模态推理链),具备CoT提示工程、Reward Model设计经验,掌握合成数据生成、多模态数据清洗、数据质量评估工具开发。熟练应用PyTorch+DeepSpeed、Megatron-LM等分布式框架,精通QLoRA、DPO、RLHF以及PPO/GRPO/DAPO等后训练技术;
3、主导过​…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、主导多模态大模型(Keye)基座模型的后训练全流程优化,包括指令微调(SFT)、强化学习(RLHF/DPO/PPO)、模型蒸馏等技术的研发与工程实现,持续提升模型在通用领域及垂直领域(如短视频理解、电商理解)的泛化能力和安全性;
2、参与多模态合成数据生成(覆盖纯文本、图文及视频等内容理解维度)、建立数据质量评估体系,设计数据蒸馏流程,推动​​数据-模型-评测​​迭代优化;
3、面向短视频社区、电商内容理解等场景,解决后训练阶段的核心挑战,​​如​​跨模态对齐一致性、长上下文推理、多任务指令冲突优化以及多模态智能推理探索等;推动技术成果转化,主导模型在快手短视频社区的集成落地(例如RAG增强系统、多模态Agent任务规划),并通过API封装与服务化支撑业务创新;
4、跟踪前沿多模态大模型后训练技术的前沿演进,探索SFT自动化迭代、轻量化RLHF以及reward model一体化等创新技术方向,形成专利或顶会论文提升团队技术影响力。
包括英文材料
学历+
PyTorch+
RLHF+
SFT+
还有更多 •••