logo of aligenie

智能互联千问C端事业群-夸克-搜索内容理解(NLP/CV/多模)算法专家-杭州

社招全职3年以上技术类-算法地点:杭州状态:招聘

任职要求


1. 具备扎实的编程基础,熟悉常用的数据结构算法,具备良好的代码风格和编程习惯。
2. 理解大模型的技术原理,有多模态大模型数据处理相关项目经验者优先考虑
3. 有良好的沟通表达能…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


在LLM重构搜索的浪潮中,数据质量决定模型智能的天花板。我们需要你构建数据与模型的「双向进化引擎」,从万亿级多模态数据中提炼认知黄金,驱动大模型突破搜索理解的终极边界!

1. 万亿级网页提炼:研发多模态数据分析框架,通过网页解析、文档智能、知识抽取等技术,完成全网万亿级搜索网页的关键信息提炼。
2. 攻克数据质量理解:设计网页质量/权威性/可信度的多维度评估模型,以及跨模态数据表征技术,提升夸克在网页知识获取的准确性与可靠性。
3. 驱动数据与算法协同进化:探索大模型时代的数据评估方法论,量化数据优化对搜索效果和模型性能的影响。
4. 打造全网优质内容库:构建多模态数据的处理和挑选管线,建立覆盖网页/图文/视频等全域内容的智能知识库。
包括英文材料
数据结构+
算法+
编程规范+
还有更多 •••
相关职位

logo of quark
社招3年以上技术类-算法

在LLM重构搜索的浪潮中,数据质量决定模型智能的天花板。我们需要你构建数据与模型的「双向进化引擎」,从万亿级多模态数据中提炼认知黄金,驱动大模型突破搜索理解的终极边界! 1. 万亿级网页提炼:研发多模态数据分析框架,通过网页解析、文档智能、知识抽取等技术,完成全网万亿级搜索网页的关键信息提炼。 2. 攻克数据质量理解:设计网页质量/权威性/可信度的多维度评估模型,以及跨模态数据表征技术,提升夸克在网页知识获取的准确性与可靠性。 3. 驱动数据与算法协同进化:探索大模型时代的数据评估方法论,量化数据优化对搜索效果和模型性能的影响。 4. 打造全网优质内容库:构建多模态数据的处理和挑选管线,建立覆盖网页/图文/视频等全域内容的智能知识库。

更新于 2026-03-27杭州
logo of quark
校招千问C端事业群秋

阿里巴巴智能信息事业群,聚焦AI在信息服务赛道的创新应用,从工具到服务,持续为用户提供高效、智能的AI应用。智能信息事业群核心产品为夸克、通义、UC浏览器、书旗小说、超级汇川等,以多产品矩阵,覆盖横跨各年龄段的7亿+用户人群,服务超10万+客户。 如果你想加入到业界最先进的文本及多模态大模型的训练和Agent应用相关的项目中; 如果你想参与内容数据的采集、存储及处理,支持大模型训练语料及AI搜索业务数据供给; 如果你想接触世界领先的大数据处理与应用的技术和平台,获得大数据浪潮之巅的各类大牛的指导; 那就加入我们吧!

更新于 2025-08-13北京|杭州
logo of quark
社招1年以上技术类-开发

1. 参与搜索业务的离线系统与策略的研发 2. 参与大规模网页数据的采集、分析、存储及平台化建设 3. 对夸克搜索海量的网页数据进行处理和挖掘 4. 参与离线系统的性能和稳定性优化

更新于 2025-12-09杭州
logo of quark
社招2年以上技术类-算法

你将加入阿里千问C端事业群的核心算法团队,直接负责千问、夸克AI问答等大模型产品背后至关重要的“大脑”——RAG(检索增强生成)系统。我们的使命是为大模型打造一个专属的、下一代搜索引擎,确保AI在回答用户问题时,能做到毫秒级响应、内容全面、信息时效性强且高度专业。 1、基于海量用户行为数据以及人工标注数据,结合信息检索、自然语言处理、大规模预训练模型等前沿技术,支持 通用RAG检索、垂直场景下的智能AI问答 等一系列业务 2、研究方向包括但不限于信息检索、大规模预训练技术、文本生成、模型蒸馏/窃取、强化学习等

更新于 2026-01-20北京