夸克智能信息-夸克-VL后训练算法专家-视觉问答方向
1、预训练模型结构和训练任务优化,提升预训练模型学习世界知识的能力; 2、持续收集和清洗大规模预训练数据,并研究数据构成和学习顺序对大模型效果的影响; 3、参与预训练模型评测,包括评测流程建设和完善、评测方法设计和优化等; 4、参与大模型Alignment相关工作,包括: a.Alignment方法设计与研究,包括SFT和 RLHF等相关的算法研究; b.Alignment整体数据建设,包括数据构建、标注以及分析其对模型能力的影响; c.从下游调优的角度探索如何提升大模型的逻辑推理能力。
1、主导多模态大模型的后训练全流程优化,包括指令微调(SFT)、强化学习(RLHF/DPO/PPO)、模型蒸馏等技术的研发与工程实现,持续提升模型在通用领域及垂直领域(如短视频理解、电商理解)的泛化能力和安全性; 2、参与多模态合成数据生成(覆盖纯文本、图文及视频等内容理解维度)、建立数据质量评估体系,设计数据蒸馏流程,推动数据-模型-评测迭代优化; 3、面向短视频社区、电商内容理解等场景,解决后训练阶段的核心挑战,如跨模态对齐一致性、长上下文推理、多任务指令冲突优化以及多模态智能推理探索等;推动技术成果转化,主导模型在快手短视频社区的集成落地(例如RAG增强系统、多模态Agent任务规划),并通过API封装与服务化支撑业务创新; 4、跟踪前沿多模态大模型后训练技术的前沿演进,探索SFT自动化迭代、轻量化RLHF以及reward model一体化等创新技术方向,形成专利或顶会论文提升团队技术影响力。
我们正在寻找在具身智能VLA(视觉-语言-动作)、空间计算(重建、SLAM等)及强化学习领域有深厚积累的算法同学,加入高德地图视觉技术中心。你将参与构建下一代地图中的感知、理解与决策系统,推动具身导航、AR/VR、场景建模等前沿技术的研发与落地。 如果你热衷于用AI改变人们出行方式,渴望在真实世界大规模数据上验证算法能力,欢迎加入我们! 岗位职责: ● 负责视觉语言动作(VLA)的具身智能模型和视觉语言模型(VLM)的研发,提升具身agent的空间理解和行动决策能力; ● 推进空间计算相关技术(如SLAM、三维重建、点云处理、姿态估计等)在下一代地图、虚拟现实等场景的应用; ● 探索强化学习在多模态大模型的后训练中的应用,提升具身/空间智能的能力天花板; ● 跟踪国际前沿技术发展,持续推动技术创新,并落实到实际应用中; ● 与工程团队紧密协作,完成从算法研发到系统部署的全流程闭环。