蚂蚁金服研究型实习生-基于空间智能理解与重建能力研究
任职要求
研究领域: -目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位 -具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScript或Go -具有上述研究领域的相关经验,包括行业经验或作为参与实验室研究 优先录用: -对技术研究充满热情,具有产生新思想和创新的能力; 在自学,问题分析和解决方面表现出色 -在国际会议上或核心期刊发表一份或多份出版物或论文 -至少3个月的全职工作
工作职责
研究领域: 计算机视觉 项目简介: 随着人工智能技术的快速发展,机器人领域正从传统的工业自动化向智能化、消费级方向转变。桌面机器人作为面向用户的电子消费品,旨在通过视觉、语言和行动的深度融合,对于空间智能的理解,实现与人类的自然交互,并完成复杂的任务。这类机器人不仅可以提高用户的生活质量,还能在教育、娱乐、办公等场景中提供智能化服务。
三维空间计算在推动城市数字化转型与智能化应用方面发挥着至关重要的作用,然而,大规模、高精确度三维数据的生成与分析面临重重挑战,包括高昂的成本、较低的效率及应用场景的局限性。近年来,图像驱动的三维场景建模技术与多模态大语言模型技术的飞速进步,为解决这一难题提供了新途径。这些技术使得利用丰富的二维图像与语言数据精准构建和解析复杂的三维空间成为可能,进而为城市规模的大场景多模态数据整合与智能计算开辟了新前景,特别是在空间智能等前沿应用领域。聚焦于大规模二三维融合计算的挑战,本项目旨在深入探究并实施三项关键技术的研发: 1、空间数据融合:探索一种通用的技术框架,实现地理地图、街景图像、三维点云、地址文本等多种空间数据的融合,通过建立它们之间的关联,挖掘更深层次的空间特征(例如位置、方向、语义信息),以增强对复杂空间环境的表达与理解能力; 2、三维空间计算:研究并利用3D多模态大语言模型的潜能,使模型不仅能够定性分析场景的语义内容与空间结构(如依据图像进行地址描述、预测遮挡效果、执行碰撞检测),还能够进行精确的定量计算(如精确地理定位、精细几何尺寸计算),从而提升三维空间信息处理的深度与广度; 3、空间应用创新:基于上述二三维融合计算的核心技术突破,结合大语言模型的功能,探索并验证新型空间智能应用场景与服务模式,推动技术成果转化与行业应用创新。
业务丰富,技术领先 高德打车算法团队深度赋能打车业务全链路,涵盖 用户增长、风控、服务管控、路线与上下车点推荐、ETA 预估、智能客服 等核心场景。多样化的业务挑战为算法创新提供了广阔的发挥空间,团队已在 AI 顶级会议发表成果。 精英阵容,国际视野 团队成员来自泰晤士世界大学排名 Top 10 的高校,以及美国常青藤、清华、北大等顶尖院校,兼具国际化背景与一流技术视野。 持续成长,共享共进 团队每周固定进行技术分享,氛围开放、互助友好;除了解答算法与工程难题,资深同事还会分享项目经验,并传授业务理解与问题解决的方法论,助你快速成长。 高德打车算法团队致力于用前沿AI技术重塑每一次打车体验。我们不是在做“推荐路线”,而是在理解用户为什么这样出行——他们偏爱哪条路?为何总在某个路口取消订单?哪些投诉背后藏着未被听见的需求? 我们正在寻找对用户行为洞察和大模型落地充满热情的实习生,与我们一起,用AI读懂出行的“潜台词”,让平台更懂你。 在这里,你将: • 构建用户出行偏好画像 基于海量行程数据,利用大模型(LLM)挖掘用户在路线选择、上下车点偏好、出行时段等方面的隐性行为模式,构建个性化出行画像,驱动个性化推荐与服务预判。 • 挖掘路线与上下车点的“隐藏特性” 分析亿级路线片段与上下车点的时空特征,通过大模型语义理解与多源信息融合,提炼可量化、可解释的“路段 / POI 质量标签”,优化点线相关推荐服务的质量。 • 提升投诉反馈的智能响应与信息透出能力 构建基于大模型的客诉理解与归因系统,自动识别投诉核心诉求(如“绕路”“司机态度”“等太久”),关联具体路线/上下车点/时段,生成结构化反馈报告,推动产品优化与客服话术升级,实现“从听抱怨到改体验”的闭环。 • 推动大模型技术在真实场景中的闭环落地 应用RAG、SFT、DPO、AI Agent等技术,构建可解释、可追踪、可迭代的智能系统,让模型不只是“跑得准”,更能“说得清、改得动、用得好”。 你的工作将直接服务全国数亿用户,每一次模型优化,都可能让一位用户少等5分钟、多一份安心、少一次投诉。你不是在写代码,你是在重塑人与出行之间的信任关系。
1、研究与算法实现: (1)参与图数据库代码知识图谱的构建与优化,借鉴最新的 RepoAudit 等研究成果。 (2)设计并实现基于强化学习(RL)的探索与反馈循环,包括智能体、动作空间、奖励机制。 (3)实验和优化多种RL策略(如PPO、DPO、GRPO、DAPO、GSPO)在真实图数据库测试场景的应用。 2、系统开发与实验: (1)构建可编译运行的图数据库测试平台,负责自动化测试流程(提出预言机→生成用例→执行验证→反馈奖励)的实现。 (2)针对开源图数据库(NeuG、Neo4j、RedisGraph、NebulaGraph等),验证并提交新型逻辑错误。 3、论文与成果输出: (1)参与撰写技术报告和学术论文,总结测试预言机生成的新方法与实验结果。 (2)协助开源端到端研究原型及技术文档的完善与维护。
业务丰富,技术领先 高德打车算法团队深度赋能打车业务全链路,涵盖 用户增长、风控、服务管控、路线与上下车点推荐、ETA 预估、智能客服 等核心场景。多样化的业务挑战为算法创新提供了广阔的发挥空间,团队已在 AI 顶级会议发表成果。 精英阵容,国际视野 团队成员来自泰晤士世界大学排名 Top 10 的高校,以及美国常青藤、清华、北大等顶尖院校,兼具国际化背景与一流技术视野。 持续成长,共享共进 团队每周固定进行技术分享,氛围开放、互助友好;除了解答算法与工程难题,资深同事还会分享项目经验,并传授业务理解与问题解决的方法论,助你快速成长。 我们正在寻找相关专业的优秀实习生,一同探索前沿大模型技术和强化学习技术在共享出行领域的深度应用,共同攻克业界难题,优化产品体验。 在这里,你将运用大模型、强化学习等先进算法技术打造全新的用户营销体系,基于海量数据训练模型并在真实业务场景中验证价值,为海量用户创造更好的打车出行体验。