夸克智能信息-千问/夸克-多模态搜索/RAG-杭州/北京
任职要求
1、计算机、数学、人工智能等相关专业硕士及以上学历 2、熟悉多模态理解、多模态检索、VLM等领域,有大规模搜索…
工作职责
团队亮点: 1、技术前沿性:主导下一代多模态搜索技术体系构建,探索大模型与搜索的深度融合 2、业务影响力:直接服务亿级用户,优化夸克、千问APP、AI眼镜等核心产品的搜索体验 3、数据与场景优势:基于百亿级图文/视频库及海量用户真实场景需求,攻克多模态对齐与检索难题 核心职责: 您将负责构建面向千问APP、夸克APP、AI眼镜等产品的统一多模态搜索技术体系,覆盖全网图文检索、图视检索、图图检索等核心能力,支撑全网搜索、智能拍搜、多模态RAG等关键场景 1、构建多模态内容理解-语义检索-语义匹配全链路技术方案,涵盖在线侧多模态query理解、embedding模型、Rerank模型,以及离线侧图片/视频/商品等内容理解和图文对齐能力建设 2、依托海量用户query和百亿图片/视频库,大模型驱动的建模范式持续创新,持续优化提升检索性能 3、核心技术攻坚:在细粒度检索、指令化检索、海量图文对齐、视频语义对齐等难点任务上的能力突破
负责大模型Large Language Model(LLM)技术在云计算服务领域多个业务场景落地的核心技术攻坚,尤其是阿里云服务领域的数字员工的建设和落地,以及阿里云智能客服大模型对话机器人、智能辅助Copilot、服务体验等场景的大模型落地,提升内外部用户的服务效率和服务体验。 岗位职责包括但不限于: 1. 负责基于通用基座大模型(通义千问等)结合领域数据构建云计算服务领域大模型,包括大模型落地业务场景识别、数据清洗/构造,LLM训练和调优,搜索增强RAG,LLM Agents等LLM关键技术方向攻坚 2. 探索基于大模型技术的服务新形态,包括多个场景的数字服务小二,,智能辅助Copilot等云计算服务新形态场景的大模型落地技术,打造云计算服务领域“大模型落地”的标杆 3. 深入阿里云服务内外部业务场景,结合大模型技术、搜索推荐、多模态等算法模型能力解决云服务领域实际业务痛点,并参与规划和设计未来云服务领域的大模型技术演进规划和落地
通义实验室工程团队致力于打造面向公众与企业的大规模、高性能在线 AI 服务平台,支撑了通义千问、通义万相及多种开源先进模型的在线服务,并推动 AI Agents、多模态应用、MCP 等前沿技术的产品化落地。团队持续攻克异构 GPU 资源调度、多模型多地域部署、多模态任务统一推理、多样化服务等级保障(SLO),以及模型推理全链路工程化的关键挑战,不断提升资源效能和系统的性能、稳定性。 1、结合LLM技术,设计和优化RAG全链路的基础架构,提升系统的吞吐能力和响应速度; 2、构建高性能,可扩展的分布式文件处理和索引构建系统,承载海量文档的知识库的索引和检索需求; 3、规划和优化检索集群,通过合理的分片,资源分配等策略降低延迟提高吞吐,针对业务场景进行服务优化; 4、建立完善的系统监控,日志分析和trace平台,能快速定位和解决系统问题。
我们是谁: -事业群简介:我们是阿里智能信息事业群,专注于千问APP、夸克APP、AI眼镜等AI to C的业务,为2亿用户群体提供AI服务,你或你身边的小伙伴中可能就是我们的用户。我们是一支致力于在AI赛道长期发展、创新务实的团队,欢迎每一位有想法、对AI有热情的小伙伴和我们一起参与这个令人激动的过程。 -团队简介:我们是“千问相机”背后的多模搜索&问答算法团队,负责构建面向千问APP、夸克APP、AI眼镜等产品的统一多模态搜索技术体系,我们基于百亿级图文/视频库及海量用户真实场景需求,攻克多模态对齐与检索难题,探索大模型与搜索的深度融合,支撑全网搜索、智能拍搜、多模态RAG等关键场景。团队技术氛围浓厚,工作氛围开放包容,加入我们,与顶尖工程师共同成长! 你会参与到: 1、多模态PlannCoT,理解用户图文query并规划合理的工具调用路径,为生成提供多模态内容供给 2、通过VLM post-training技术提升模型在行业知识、多轮对话、RA引用、偏好对齐等专项能力 3、构建多模态数据生产体系,提升模型在数字化内容理解、图文对齐、图表理解等内化能力 4、探索强化学习在复杂交互场景中的应用,尤其是多模态planning、视觉reasoning
我们是谁: -事业群简介:我们是阿里智能信息事业群,专注于千问APP、夸克APP、AI眼镜等AI to C的业务,为2亿用户群体提供AI服务,你或你身边的小伙伴中可能就是我们的用户。我们是一支致力于在AI赛道长期发展、创新务实的团队,欢迎每一位有想法、对AI有热情的小伙伴和我们一起参与这个令人激动的过程。 -团队简介:我们是“千问相机”背后的多模搜索&问答算法团队,负责构建面向千问APP、夸克APP、AI眼镜等产品的统一多模态理解、搜索、问答技术体系,我们基于百亿级图文/视频库及海量用户真实场景需求,攻克多模态对齐与检索难题,探索大模型与搜索的深度融合,支撑全网搜索、智能拍搜、多模态RAG等关键场景。团队技术氛围浓厚,工作氛围开放包容,加入我们,与顶尖工程师共同成长! ⭐️ 你会参与到: 1.与算法工程师携手深入探索大模型的底层原理,能够更好地理解数据与模型之间的关系,为模型训练提供更具针对性的标注策略,加速模型的优化与迭代。 2.深度参与数据与模型的交互过程,理解不同领域知识之间的关联和相互影响,从而拓展自己的知识边界,培养跨学科的思维能力,能够从多个角度理解数据、理解知识、理解智能。 3.通过对数据作为人工智能核心驱动因素之一的深刻理解和实战参与,进一步提升快速学习的能力、创新思维激发,对个人未来的职业发展中提供更多的可能性,进一步提升未来在职场的竞争力。