蚂蚁金服蚂蚁集团-AI搜索算法专家-北京/杭州
任职要求
1、两年以上机器学习实际应用经验,拥有搜索、推荐、广告等方向丰富的项目经验,在Query解析、内容理解、离线建库、召回、相关性、排序、RAG生成等方面有深入实践;具备大模型相关经验更佳; 2、熟练掌握机器学习及相关算法,能够灵活运用自然语言处理、匹配技术、预估、…
工作职责
1、参与和负责AI搜索场景下的核心搜索算法研发,持续提升Query理解、内容理解、离线建库、召回、相关性、排序、RAG生成等环节的效果; 2、支持多元业务需求的快速迭代,始终以优化用户体验与提升业务价值为目标; 3、关注AI搜索技术前沿进展和业界先进应用,不断探索,持续创新突破核心技术。
你将加入阿里千问C端事业群的核心算法团队,直接负责千问、夸克AI问答等大模型产品背后至关重要的“大脑”——RAG(检索增强生成)系统。我们的使命是为大模型打造一个专属的、下一代搜索引擎,确保AI在回答用户问题时,能做到毫秒级响应、内容全面、信息时效性强且高度专业。 1、基于海量用户行为数据以及人工标注数据,结合信息检索、自然语言处理、大规模预训练模型等前沿技术,支持 通用RAG检索、垂直场景下的智能AI问答 等一系列业务 2、研究方向包括但不限于信息检索、大规模预训练技术、文本生成、模型蒸馏/窃取、强化学习等
你将作为AI搜索算法专家,加入千问C端的核心算法团队,深度参与千问、夸克两大战略级AI产品的研发,主导构建业界领先的AI搜索体系,直接驱动新一代AI问答的革新。 你的核心使命与工作包括: 1. 负责专业领域多源异构数据的知识理解,针对专业文献、超长文档、多语文本等,构建深入的解析、抽取、理解与评估体系,夯实AI问答的知识底座; 2. 负责前沿检索技术的研发与落地,涵盖稀疏召回、稠密召回、混合检索、生成式检索等核心方向,设计并优化端到端的检索链路,打造行业标杆级检索架构。
1. 跨模态长程预训练:设计并实现文本、图像、视频等多模态对齐与融合的长程训练策略,操控万卡级 GPU 集群,协同 Pretrain / CPT / SFT / RLVR / RLHF 全链路,对超大参数基座模型进行高效分布式优化。 2. 前沿技术攻坚:深入探索 MoE 稀疏化、训练算法与对齐范式创新、可解释性与质量监控、多模态推理、mRAG、百万 Token 级长文处理、Agent&工具链机制等底层原理与技术。 3. 高性能训练框架持续升级:与系统团队共建张量并行、流水并行、混合精度等高性能训练框架,持续提升训练吞吐与稳定性。 4. 学术与行业影响力打造:快速跟踪 NeurIPS / CVPR / ACL 等顶会成果及开源项目,输出专利与论文,树立行业技术标杆 5. 高速驱动夸克AI相关业务:赋能夸克 AI 相机、AI 搜索·深度思考、DeepResearch、创意写作、AI 助手等核心产品,实现多模态能力的快速迭代与落地。 加入我们,你将获得 1. 顶尖资源:与行业专家并肩作战,万卡算力与海量数据随手可用,持续挑战技术天花板。 2. 高速成长:极具竞争力的薪酬福利与纯粹的工程师文化,为你的职业加速。 3. 时代机遇:亲历 AGI 关键技术的诞生与规模化应用,在智能时代留下你的名字。 如果你渴望驰骋于大模型与 AGI 的蓝海,这里就是你的最佳舞台。立即加入我们,共创智能新时代!
我们是阿里巴巴通义实验室AI搜索算法团队,专注于下一代AI驱动搜索技术的前沿研究与产业化落地。团队在文本搜索、多模态检索、大模型驱动的搜索范式等方向持续创新,负责通义实验室AI搜索领域的核心技术研发和产品落地。 团队此前开源的GTE/GME/Qwen3-Embedding系列表征与重排模型累计下载量突破1亿次,是开源社区最受欢迎的检索模型之一。欢迎加入我们,共同探索AI搜索的未来,创造对社区和产业具有深远价值的技术突破。 工作职责: 1. 负责搜索、RAG核心模块的算法创新与优化,涵盖文本/多模态Query理解、Embedding表征学习、ReRank重排序模型等,确保技术效果保持行业领先水平。 2. 针对问答系统、智能客服、多模态Memory等实际应用场景,优化搜索/RAG/AI Agent端到端框架,全面提升系统的准确性、执行效率和可扩展性。 3. 与产品、工程团队深度协作,推动核心模型的开源发布和业务应用落地,支撑关键项目的高质量交付。