夸克智能信息-千问/夸克-多模态搜索/RAG-杭州/北京

社招全职2年以上技术类-算法2025-11-28地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1、计算机、数学、人工智能等相关专业硕士及以上学历
2、熟悉多模态理解、多模态检索、VLM等领域，有大规模搜索…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队亮点：
1、技术前沿性：主导下一代多模态搜索技术体系构建，探索大模型与搜索的深度融合
2、业务影响力：直接服务亿级用户，优化夸克、千问APP、AI眼镜等核心产品的搜索体验
3、数据与场景优势：基于百亿级图文/视频库及海量用户真实场景需求，攻克多模态对齐与检索难题
核心职责：
您将负责构建面向千问APP、夸克APP、AI眼镜等产品的统一多模态搜索技术体系，覆盖全网图文检索、图视检索、图图检索等核心能力，支撑全网搜索、智能拍搜、多模态RAG等关键场景
1、构建多模态内容理解-语义检索-语义匹配全链路技术方案，涵盖在线侧多模态query理解、embedding模型、Rerank模型，以及离线侧图片/视频/商品等内容理解和图文对齐能力建设
2、依托海量用户query和百亿图片/视频库，大模型驱动的建模范式持续创新，持续优化提升检索性能
3、核心技术攻坚：在细粒度检索、指令化检索、海量图文对齐、视频语义对齐等难点任务上的能力突破

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

算法+

SFT+

还有更多 •••

登录查看完整学习资料

相关职位

阿里云智能-大模型智能算法专家-杭州/北京

社招5年以上云智能集团

负责大模型Large Language Model(LLM)技术在云计算服务领域多个业务场景落地的核心技术攻坚，尤其是阿里云服务领域的数字员工的建设和落地，以及阿里云智能客服大模型对话机器人、智能辅助Copilot、服务体验等场景的大模型落地，提升内外部用户的服务效率和服务体验。岗位职责包括但不限于： 1. 负责基于通用基座大模型(通义千问等)结合领域数据构建云计算服务领域大模型，包括大模型落地业务场景识别、数据清洗/构造，LLM训练和调优，搜索增强RAG，LLM Agents等LLM关键技术方向攻坚 2. 探索基于大模型技术的服务新形态，包括多个场景的数字服务小二，，智能辅助Copilot等云计算服务新形态场景的大模型落地技术，打造云计算服务领域“大模型落地”的标杆 3. 深入阿里云服务内外部业务场景，结合大模型技术、搜索推荐、多模态等算法模型能力解决云服务领域实际业务痛点，并参与规划和设计未来云服务领域的大模型技术演进规划和落地

更新于 2025-10-28杭州

通义实验室-技术专家-知识库搜索增强(RAG)

社招5年以上技术类-开发

通义实验室工程团队致力于打造面向公众与企业的大规模、高性能在线 AI 服务平台，支撑了通义千问、通义万相及多种开源先进模型的在线服务，并推动 AI Agents、多模态应用、MCP 等前沿技术的产品化落地。团队持续攻克异构 GPU 资源调度、多模型多地域部署、多模态任务统一推理、多样化服务等级保障（SLO），以及模型推理全链路工程化的关键挑战，不断提升资源效能和系统的性能、稳定性。 1、结合LLM技术，设计和优化RAG全链路的基础架构，提升系统的吞吐能力和响应速度； 2、构建高性能，可扩展的分布式文件处理和索引构建系统，承载海量文档的知识库的索引和检索需求； 3、规划和优化检索集群，通过合理的分片，资源分配等策略降低延迟提高吞吐，针对业务场景进行服务优化； 4、建立完善的系统监控，日志分析和trace平台，能快速定位和解决系统问题。

更新于 2025-12-10北京|杭州

智能信息-千问/夸克-大模型高级算法专家-Chat方向

社招3年以上技术类-算法

全面负责定义、设计并实现下一代对话系统的核心算法与交互范式，解决当前对话模型在多轮交互、知识应用、共情能力等方面的挑战，探索并引领模型在个性化、主动性、拟人化等前沿方向的技术突破。直接决定数亿夸克用户在Chat场景的与AI 的交互体验，塑造夸克在未来对话式 AI 时代的领先地位。 1. 对话体验定义与规划。深入分析用户意图与行为，结合业务场景，制定并执行对话体验的中长期技术演进路线图。并密切追踪并研究对话式 AI 领域的最新进展，包括主动式对话策略、多模态对话 (语音/视觉融合)、AI Agent 中的对话流控制等。您将主导定义“顶级对话体验”的标准，并将其分解为可落地、可量化的算法迭代目标。 2. 多轮对话与上下文理解。攻坚并解决长程、复杂多轮对话中的核心技术难题，包括但不限于指令遵循、上下文精准理解、长程记忆与遗忘机制、隐式意图识别等。您将设计创新的模型结构与训练策略，使模型具备真正连贯、有逻辑的对话能力。 3. 对话回复准确与全面。主导研发将外部知识 (如搜索、工具调用) 与大模型进行深度、动态融合的先进技术。致力于解决模型在对话中的意图偏离、事实性错误、内容不详实和知识更新不及时等问题，并通过 RAG 新范式或其他创新方法，显著提升对话的准确性与信息量。 4. 评测体系与数据飞轮。建立并完善一套科学、全面的对话能力评测体系，能够精准衡量模型的综合对话质量 (Coherence, Empathy, Informativeness 等)。设计并驱动高效的数据闭环系统，利用真实用户反馈持续、自动化地优化模型。

更新于 2025-12-08北京|杭州

多模态算法实习生-多模搜索&问答

实习日常实习生

我们是谁： -事业群简介：我们是阿里智能信息事业群，专注于千问APP、夸克APP、AI眼镜等AI to C的业务，为2亿用户群体提供AI服务，你或你身边的小伙伴中可能就是我们的用户。我们是一支致力于在AI赛道长期发展、创新务实的团队，欢迎每一位有想法、对AI有热情的小伙伴和我们一起参与这个令人激动的过程。 -团队简介：我们是“千问相机”背后的多模搜索&问答算法团队，负责构建面向千问APP、夸克APP、AI眼镜等产品的统一多模态搜索技术体系，我们基于百亿级图文/视频库及海量用户真实场景需求，攻克多模态对齐与检索难题，探索大模型与搜索的深度融合，支撑全网搜索、智能拍搜、多模态RAG等关键场景。团队技术氛围浓厚，工作氛围开放包容，加入我们，与顶尖工程师共同成长！你会参与到： 1、多模态PlannCoT，理解用户图文query并规划合理的工具调用路径，为生成提供多模态内容供给 2、通过VLM post-training技术提升模型在行业知识、多轮对话、RA引用、偏好对齐等专项能力 3、构建多模态数据生产体系，提升模型在数字化内容理解、图文对齐、图表理解等内化能力 4、探索强化学习在复杂交互场景中的应用，尤其是多模态planning、视觉reasoning

更新于 2025-12-03杭州