logo of kuaishou

快手多模态大模型后训练算法专家​-【Keye】

社招全职D4910地点:北京状态:招聘

任职要求


1、​​硕士及以上学历,计算机科学、人工智能、自动化、数学等相关专业优先;
2、精通多模态任务设计范式(如视觉思维链、跨模态推理链),具备CoT提示工程、Reward Model设计经验,掌握合成数据生成、多模态数据清洗、数据质量评估工具开发。熟练应用PyTorch+DeepSpeed、Megatron-LM等分布式框架,精通QLoRA、DPO、RLHF以及PPO/GRPO/DAPO等后训练技术;
3、主导过​…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、主导多模态大模型的后训练全流程优化,包括指令微调(SFT)、强化学习(RLHF/DPO/PPO)、模型蒸馏等技术的研发与工程实现,持续提升模型在通用领域及垂直领域(如短视频理解、电商理解)的泛化能力和安全性;
2、参与多模态合成数据生成(覆盖纯文本、图文及视频等内容理解维度)、建立数据质量评估体系,设计数据蒸馏流程,推动​​数据-模型-评测​​迭代优化;
3、面向短视频社区、电商内容理解等场景,解决后训练阶段的核心挑战,​​如​​跨模态对齐一致性、长上下文推理、多任务指令冲突优化以及多模态智能推理探索等;推动技术成果转化,主导模型在快手短视频社区的集成落地(例如RAG增强系统、多模态Agent任务规划),并通过API封装与服务化支撑业务创新;
4、跟踪前沿多模态大模型后训练技术的前沿演进,探索SFT自动化迭代、轻量化RLHF以及reward model一体化等创新技术方向,形成专利或顶会论文提升团队技术影响力。
包括英文材料
学历+
PyTorch+
SFT+
还有更多 •••
相关职位

logo of quark
社招1年以上技术类-算法

1. 探索研究多模态理解、视频理解等方向的前沿技术; 2. 关注多模态、全模态大模型的后训练相关技术,研判RL在多模态理解上的潜力;

更新于 2025-08-27北京|杭州|上海
logo of tongyi
社招1年以上技术类-算法

1、探索研究多模态理解、视频理解等方向的前沿技术。 2、关注多模态、全模态大模型的后训练相关技术,研判RL在多模态理解上的潜力。

更新于 2025-11-26北京|杭州|上海
logo of antgroup
社招技术类-算法

1、参与设计并实现 代码生成(可视化方向)、Function call、RAG等方向的大模型后训练算法。 2、结合业务数据和场景,设计Post training的高质量数据构建方案(含数据洞察、数据合成、数据质量优化等)提升模型的应用效果。 3、与工程以及产运团队协作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地; 4、密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性;

更新于 2025-05-22杭州
logo of antgroup
社招3年以上技术类-算法

1、参与设计并实现 代码生成(可视化方向)、Function call、RAG等方向的大模型后训练算法。 2、结合业务数据和场景,设计Post training的高质量数据构建方案(含数据洞察、数据合成、数据质量优化等)提升模型的应用效果。 3、与工程以及产运团队协作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地; 4、密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性;

更新于 2025-08-27杭州