logo of quark

夸克智能信息-夸克-VL后训练算法专家-视觉问答方向

社招全职2年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1、计算机或数学相关专业,优秀的算法功底,熟练掌握一门开发语言和算法框架
2、有一定的多模态功底,比如图文对齐、多模态内容理解、跨模态检索等均可
3、掌握SFT/DPO/PPO等大模型对齐技术,有agent开发、优化经验者优先

工作职责


1.负责视觉问答算法能力建设,应用在夸克AI相机、夸克眼镜场景,通过多模态/大模型能力持续提升用户与物理世界交互的能力;
2.持续优化VL能力,驱动模型/Agent在需求理解、路径规划、工具调用、mRAG等方面的性能提升;
3.同时深度结合场景,对定向品类制定和落地解决方案,并与业务一起挖掘探索新场景。
包括英文材料
算法+
SFT+
大模型+
AI agent+
相关职位

logo of quark
社招1年以上技术类-算法

1. 探索研究多模态理解、视频理解等方向的前沿技术; 2. 关注多模态、全模态大模型的后训练相关技术,研判RL在多模态理解上的潜力;

更新于 2025-08-27
logo of kuaishou
社招D12518

1、预训练模型结构和训练任务优化,提升预训练模型学习世界知识的能力; 2、持续收集和清洗大规模预训练数据,并研究数据构成和学习顺序对大模型效果的影响; 3、参与预训练模型评测,包括评测流程建设和完善、评测方法设计和优化等; 4、参与大模型Alignment相关工作,包括: a.Alignment方法设计与研究,包括SFT和 RLHF等相关的算法研究; b.Alignment整体数据建设,包括数据构建、标注以及分析其对模型能力的影响; c.从下游调优的角度探索如何提升大模型的逻辑推理能力。

更新于 2025-06-11
logo of kuaishou
社招D4910

1、主导多模态大模型的后训练全流程优化,包括指令微调(SFT)、强化学习(RLHF/DPO/PPO)、模型蒸馏等技术的研发与工程实现,持续提升模型在通用领域及垂直领域(如短视频理解、电商理解)的泛化能力和安全性; 2、参与多模态合成数据生成(覆盖纯文本、图文及视频等内容理解维度)、建立数据质量评估体系,设计数据蒸馏流程,推动​​数据-模型-评测​​迭代优化; 3、面向短视频社区、电商内容理解等场景,解决后训练阶段的核心挑战,​​如​​跨模态对齐一致性、长上下文推理、多任务指令冲突优化以及多模态智能推理探索等;推动技术成果转化,主导模型在快手短视频社区的集成落地(例如RAG增强系统、多模态Agent任务规划),并通过API封装与服务化支撑业务创新; 4、跟踪前沿多模态大模型后训练技术的前沿演进,探索SFT自动化迭代、轻量化RLHF以及reward model一体化等创新技术方向,形成专利或顶会论文提升团队技术影响力。

更新于 2025-08-05
logo of amap
社招3年以上技术类-算法

我们正在寻找在具身智能VLA(视觉-语言-动作)、空间计算(重建、SLAM等)及强化学习领域有深厚积累的算法同学,加入高德地图视觉技术中心。你将参与构建下一代地图中的感知、理解与决策系统,推动具身导航、AR/VR、场景建模等前沿技术的研发与落地。 如果你热衷于用AI改变人们出行方式,渴望在真实世界大规模数据上验证算法能力,欢迎加入我们! 岗位职责: ● 负责视觉语言动作(VLA)的具身智能模型和视觉语言模型(VLM)的研发,提升具身agent的空间理解和行动决策能力; ● 推进空间计算相关技术(如SLAM、三维重建、点云处理、姿态估计等)在下一代地图、虚拟现实等场景的应用; ● 探索强化学习在多模态大模型的后训练中的应用,提升具身/空间智能的能力天花板; ● 跟踪国际前沿技术发展,持续推动技术创新,并落实到实际应用中; ● 与工程团队紧密协作,完成从算法研发到系统部署的全流程闭环。

更新于 2025-08-28