夸克智能信息-千问/夸克-多模态理解/问答算法-AI相机/AI眼镜
任职要求
1、计算机、数学、机器学习等相关专业硕士及以上学历 2、具有多模态、post-training 或强化学习…
工作职责
核心职责: 构建新一代AI相机与智能眼镜的核心交互能力,应用在千问/夸克APP和夸克眼镜,覆盖图片识别、商品识价、学习办公、生活健康、文本创作等全场景。包括: 1、多模态PlannCoT,理解用户图文query并规划合理的工具调用路径,为生成提供多模态内容供给 2、通过VLM post-training技术提升模型在行业知识、多轮对话、RA引用、偏好对齐等专项能力 3、构建多模态数据生产体系,提升模型在数字化内容理解、图文对齐、图表理解等内化能力 4、探索强化学习在复杂交互场景中的应用,尤其是多模态planning、视觉reasoning
核心职责: 构建新一代AI相机与智能眼镜的核心交互能力,应用在千问/夸克APP和夸克眼镜,覆盖图片识别、商品识价、学习办公、生活健康、文本创作等全场景。包括: 1、多模态PlannCoT,理解用户图文query并规划合理的工具调用路径,为生成提供多模态内容供给 2、通过VLM post-training技术提升模型在行业知识、多轮对话、RA引用、偏好对齐等专项能力 3、构建多模态数据生产体系,提升模型在数字化内容理解、图文对齐、图表理解等内化能力 4、探索强化学习在复杂交互场景中的应用,尤其是多模态planning、视觉reasoning
我们是谁: -事业群简介:我们是阿里智能信息事业群,专注于千问APP、夸克APP、AI眼镜等AI to C的业务,为2亿用户群体提供AI服务,你或你身边的小伙伴中可能就是我们的用户。我们是一支致力于在AI赛道长期发展、创新务实的团队,欢迎每一位有想法、对AI有热情的小伙伴和我们一起参与这个令人激动的过程。 -团队简介:我们是“千问相机”背后的多模搜索&问答算法团队,负责构建面向千问APP、夸克APP、AI眼镜等产品的统一多模态理解、搜索、问答技术体系,我们基于百亿级图文/视频库及海量用户真实场景需求,攻克多模态对齐与检索难题,探索大模型与搜索的深度融合,支撑全网搜索、智能拍搜、多模态RAG等关键场景。团队技术氛围浓厚,工作氛围开放包容,加入我们,与顶尖工程师共同成长! ⭐️ 你会参与到: 1.与算法工程师携手深入探索大模型的底层原理,能够更好地理解数据与模型之间的关系,为模型训练提供更具针对性的标注策略,加速模型的优化与迭代。 2.深度参与数据与模型的交互过程,理解不同领域知识之间的关联和相互影响,从而拓展自己的知识边界,培养跨学科的思维能力,能够从多个角度理解数据、理解知识、理解智能。 3.通过对数据作为人工智能核心驱动因素之一的深刻理解和实战参与,进一步提升快速学习的能力、创新思维激发,对个人未来的职业发展中提供更多的可能性,进一步提升未来在职场的竞争力。
我们是谁: -事业群简介:我们是阿里智能信息事业群,专注于千问APP、夸克APP、AI眼镜等AI to C的业务,为2亿用户群体提供AI服务,你或你身边的小伙伴中可能就是我们的用户。我们是一支致力于在AI赛道长期发展、创新务实的团队,欢迎每一位有想法、对AI有热情的小伙伴和我们一起参与这个令人激动的过程。 -团队简介:我们是“千问相机”背后的多模搜索&问答算法团队,负责构建面向千问APP、夸克APP、AI眼镜等产品的统一多模态搜索技术体系,我们基于百亿级图文/视频库及海量用户真实场景需求,攻克多模态对齐与检索难题,探索大模型与搜索的深度融合,支撑全网搜索、智能拍搜、多模态RAG等关键场景。团队技术氛围浓厚,工作氛围开放包容,加入我们,与顶尖工程师共同成长! 你会参与到: 1、多模态PlannCoT,理解用户图文query并规划合理的工具调用路径,为生成提供多模态内容供给 2、通过VLM post-training技术提升模型在行业知识、多轮对话、RA引用、偏好对齐等专项能力 3、构建多模态数据生产体系,提升模型在数字化内容理解、图文对齐、图表理解等内化能力 4、探索强化学习在复杂交互场景中的应用,尤其是多模态planning、视觉reasoning
岗位描述: 全面负责夸克大模型在 Post-Training 能力进化和上限突破、持续推进模型能力边界和商业价值的不断延伸。通过对前沿算法的极致探索和高效能工程体系的构建,驱动模型在逻辑推理、问答、复杂多轮上下文、指令遵循、Agent 智能体、多模态交互等关键领域实现突破性进展,打造世界一流的模型效果,并定义其在未来 AI 应用中的核心价值。 工作职责: ● 【战略规划与技术引领】 制定并执行大模型 Post-training 的中长期技术路线图,预判并布局下一代对齐技术、能力增强及对齐方案。主导核心算法的战略方向,确保技术路径与公司业务战略高度协同。 ● 【核心能力与壁垒构建】 领导团队进行体系化的数据驱动实验,不仅局限于日常迭代,更要建立可规模化的能力提升范式。您将攻坚并解决模型在复杂指令遵循、通用问答、RAG、深度逻辑推理、内容创作、Tool-Using 等方面的瓶颈问题,构建技术壁垒。 ● 【前沿算法研究与创新】 深入探索并推动 Post-training 领域的前沿算法创新,包括但不限于 RLHF/RLAIF 的新范式、模型融合 (Model Fusion/Merge) 、模型蒸馏及 MoE 模型的高效对齐策略。您的目标是显著降低模型幻觉、提升推理的效果、加强模型复杂指令的遵循能力。 ● 【多模态与未来探索】 从统一多模态模型的战略视角出发,您将指导并规划多模态统一大模型的 Post-training 技术融合。探索并落地高效的多模态 SFT 数据构建、跨模态能力协同训练及对齐策略,确保模型在图文问答、视频对话 等复杂场景下实现无缝、精准的理解与生成。 ● 【团队领导与效能提升】 负责 Post-training 算法团队的组建、培养与管理,打造一支具备高效执行力和持续创新能力的顶尖团队。您将指导并优化从研究、实验、评测到部署的全链路工具链与工程框架,实现研发效能的倍增。