快手多模态大模型后训练算法专家-【Keye】
社招全职J0011地点:北京状态:招聘
任职要求
1、硕士及以上学历,计算机科学、人工智能、自动化、数学等相关专业优先; 2、精通多模态任务设计范式(如视觉思维链、跨模态推理链),具备CoT提示工程、Reward Model设计经验,掌握合成数据生成、多模态数据清洗、数据质量评估工具开发。熟练应用PyTorch+DeepSpeed、Megatron-LM等分布式框架,精通QLoRA、DPO、RLHF以及PPO/GRPO/DAPO等后训练技术; 3、主导过…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、主导多模态大模型(Keye)基座模型的后训练全流程优化,包括指令微调(SFT)、强化学习(RLHF/DPO/PPO)、模型蒸馏等技术的研发与工程实现,持续提升模型在通用领域及垂直领域(如短视频理解、电商理解)的泛化能力和安全性; 2、参与多模态合成数据生成(覆盖纯文本、图文及视频等内容理解维度)、建立数据质量评估体系,设计数据蒸馏流程,推动数据-模型-评测迭代优化; 3、面向短视频社区、电商内容理解等场景,解决后训练阶段的核心挑战,如跨模态对齐一致性、长上下文推理、多任务指令冲突优化以及多模态智能推理探索等;推动技术成果转化,主导模型在快手短视频社区的集成落地(例如RAG增强系统、多模态Agent任务规划),并通过API封装与服务化支撑业务创新; 4、跟踪前沿多模态大模型后训练技术的前沿演进,探索SFT自动化迭代、轻量化RLHF以及reward model一体化等创新技术方向,形成专利或顶会论文提升团队技术影响力。
包括英文材料
学历+
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
数据治理+
https://www.ibm.com/think/topics/data-governance
Data governance is the data management discipline that focuses on the quality, security and availability of an organization’s data.
https://www.youtube.com/watch?v=uPsUjKLHLAg
Building data fabric eliminates the technological complexities of data governance so users can connect to the right data at the right time, regardless of where it resides.
还有更多 •••
相关职位
社招技术类-算法
1、参与设计并实现 代码生成(可视化方向)、Function call、RAG等方向的大模型后训练算法。 2、结合业务数据和场景,设计Post training的高质量数据构建方案(含数据洞察、数据合成、数据质量优化等)提升模型的应用效果。 3、与工程以及产运团队协作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地; 4、密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性;
更新于 2025-05-22杭州
社招3年以上技术类-算法
1、参与设计并实现 代码生成(可视化方向)、Function call、RAG等方向的大模型后训练算法。 2、结合业务数据和场景,设计Post training的高质量数据构建方案(含数据洞察、数据合成、数据质量优化等)提升模型的应用效果。 3、与工程以及产运团队协作,参与或负责大语言模型、多模态大模型等业务场景的后训练端到端效果提升及落地; 4、密切关注业界 LLM 微调算法和数据提质领域的前沿论文,并整合新技术和算法到训练引擎中,提升框架的领先性。
更新于 2025-12-17杭州
社招1年以上技术类-算法
1. 探索研究多模态理解、视频理解等方向的前沿技术; 2. 关注多模态、全模态大模型的后训练相关技术,研判RL在多模态理解上的潜力;
更新于 2025-08-27北京|杭州|上海