logo of quark

夸克智能信息-千问/夸克-多模态搜索/RAG-杭州/北京

社招全职2年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1、计算机、数学、人工智能等相关专业硕士及以上学历
2、熟悉多模态理解、多模态检索、VLM等领域,有大规模搜索…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队亮点:
1、技术前沿性:主导下一代多模态搜索技术体系构建,探索大模型与搜索的深度融合
2、业务影响力:直接服务亿级用户,优化夸克、千问APP、AI眼镜等核心产品的搜索体验
3、数据与场景优势:基于百亿级图文/视频库及海量用户真实场景需求,攻克多模态对齐与检索难题
核心职责:
您将负责构建面向千问APP、夸克APP、AI眼镜等产品的统一多模态搜索技术体系,覆盖全网图文检索、图视检索、图图检索等核心能力,支撑全网搜索、智能拍搜、多模态RAG等关键场景
1、构建多模态内容理解-语义检索-语义匹配全链路技术方案,涵盖在线侧多模态query理解、embedding模型、Rerank模型,以及离线侧图片/视频/商品等内容理解和图文对齐能力建设
2、依托海量用户query和百亿图片/视频库,大模型驱动的建模范式持续创新,持续优化提升检索性能
3、核心技术攻坚:在细粒度检索、指令化检索、海量图文对齐、视频语义对齐等难点任务上的能力突破
包括英文材料
算法+
SFT+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能集团

负责大模型Large Language Model(LLM)技术在云计算服务领域多个业务场景落地的核心技术攻坚,尤其是阿里云服务领域的数字员工的建设和落地,以及阿里云智能客服大模型对话机器人、智能辅助Copilot、服务体验等场景的大模型落地,提升内外部用户的服务效率和服务体验。 岗位职责包括但不限于: 1. 负责基于通用基座大模型(通义千问等)结合领域数据构建云计算服务领域大模型,包括大模型落地业务场景识别、数据清洗/构造,LLM训练和调优,搜索增强RAG,LLM Agents等LLM关键技术方向攻坚 2. 探索基于大模型技术的服务新形态,包括多个场景的数字服务小二,,智能辅助Copilot等云计算服务新形态场景的大模型落地技术,打造云计算服务领域“大模型落地”的标杆 3. 深入阿里云服务内外部业务场景,结合大模型技术、搜索推荐、多模态等算法模型能力解决云服务领域实际业务痛点,并参与规划和设计未来云服务领域的大模型技术演进规划和落地

更新于 2025-10-28杭州
logo of tongyi
社招5年以上技术类-开发

通义实验室工程团队致力于打造面向公众与企业的大规模、高性能在线 AI 服务平台,支撑了通义千问、通义万相及多种开源先进模型的在线服务,并推动 AI Agents、多模态应用、MCP 等前沿技术的产品化落地。团队持续攻克异构 GPU 资源调度、多模型多地域部署、多模态任务统一推理、多样化服务等级保障(SLO),以及模型推理全链路工程化的关键挑战,不断提升资源效能和系统的性能、稳定性。 1、结合LLM技术,设计和优化RAG全链路的基础架构,提升系统的吞吐能力和响应速度; 2、构建高性能,可扩展的分布式文件处理和索引构建系统,承载海量文档的知识库的索引和检索需求; 3、规划和优化检索集群,通过合理的分片,资源分配等策略降低延迟提高吞吐,针对业务场景进行服务优化; 4、建立完善的系统监控,日志分析和trace平台,能快速定位和解决系统问题。

更新于 2025-12-10北京|杭州
logo of quark
社招3年以上技术类-算法

全面负责定义、设计并实现下一代对话系统的核心算法与交互范式,解决当前对话模型在多轮交互、知识应用、共情能力等方面的挑战,探索并引领模型在个性化、主动性、拟人化等前沿方向的技术突破。直接决定数亿夸克用户在Chat场景的与AI 的交互体验,塑造夸克在未来对话式 AI 时代的领先地位。 1. 对话体验定义与规划。深入分析用户意图与行为,结合业务场景,制定并执行对话体验的中长期技术演进路线图。并密切追踪并研究对话式 AI 领域的最新进展,包括主动式对话策略、多模态对话 (语音/视觉融合)、AI Agent 中的对话流控制等。您将主导定义“顶级对话体验”的标准,并将其分解为可落地、可量化的算法迭代目标。 2. 多轮对话与上下文理解。攻坚并解决长程、复杂多轮对话中的核心技术难题,包括但不限于指令遵循、上下文精准理解、长程记忆与遗忘机制、隐式意图识别等。您将设计创新的模型结构与训练策略,使模型具备真正连贯、有逻辑的对话能力。 3. 对话回复准确与全面。主导研发将外部知识 (如搜索、工具调用) 与大模型进行深度、动态融合的先进技术。致力于解决模型在对话中的意图偏离、事实性错误、内容不详实和知识更新不及时等问题,并通过 RAG 新范式或其他创新方法,显著提升对话的准确性与信息量。 4. 评测体系与数据飞轮。建立并完善一套科学、全面的对话能力评测体系,能够精准衡量模型的综合对话质量 (Coherence, Empathy, Informativeness 等)。设计并驱动高效的数据闭环系统,利用真实用户反馈持续、自动化地优化模型。

更新于 2025-12-08北京|杭州
logo of quark
实习日常实习生

我们是谁: -事业群简介:我们是阿里智能信息事业群,专注于千问APP、夸克APP、AI眼镜等AI to C的业务,为2亿用户群体提供AI服务,你或你身边的小伙伴中可能就是我们的用户。我们是一支致力于在AI赛道长期发展、创新务实的团队,欢迎每一位有想法、对AI有热情的小伙伴和我们一起参与这个令人激动的过程。 -团队简介:我们是“千问相机”背后的多模搜索&问答算法团队,负责构建面向千问APP、夸克APP、AI眼镜等产品的统一多模态搜索技术体系,我们基于百亿级图文/视频库及海量用户真实场景需求,攻克多模态对齐与检索难题,探索大模型与搜索的深度融合,支撑全网搜索、智能拍搜、多模态RAG等关键场景。团队技术氛围浓厚,工作氛围开放包容,加入我们,与顶尖工程师共同成长! 你会参与到: 1、多模态PlannCoT,理解用户图文query并规划合理的工具调用路径,为生成提供多模态内容供给 2、通过VLM post-training技术提升模型在行业知识、多轮对话、RA引用、偏好对齐等专项能力 3、构建多模态数据生产体系,提升模型在数字化内容理解、图文对齐、图表理解等内化能力 4、探索强化学习在复杂交互场景中的应用,尤其是多模态planning、视觉reasoning

更新于 2025-12-03杭州