logo of antgroup

蚂蚁金服研究型实习生-基于空间智能理解与重建能力研究

实习兼职研究型实习生地点:上海状态:招聘

任职要求


研究领域:
-目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位
-具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScriptGo
-具有上述研究领域的…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


研究领域:
  计算机视觉
项目简介:
  随着人工智能技术的快速发展,机器人领域正从传统的工业自动化向智能化、消费级方向转变。桌面机器人作为面向用户的电子消费品,旨在通过视觉、语言和行动的深度融合,对于空间智能的理解,实现与人类的自然交互,并完成复杂的任务。这类机器人不仅可以提高用户的生活质量,还能在教育、娱乐、办公等场景中提供智能化服务。
包括英文材料
学历+
Java+
还有更多 •••
相关职位

logo of aliyun
实习阿里云研究型实习

三维空间计算在推动城市数字化转型与智能化应用方面发挥着至关重要的作用,然而,大规模、高精确度三维数据的生成与分析面临重重挑战,包括高昂的成本、较低的效率及应用场景的局限性。近年来,图像驱动的三维场景建模技术与多模态大语言模型技术的飞速进步,为解决这一难题提供了新途径。这些技术使得利用丰富的二维图像与语言数据精准构建和解析复杂的三维空间成为可能,进而为城市规模的大场景多模态数据整合与智能计算开辟了新前景,特别是在空间智能等前沿应用领域。聚焦于大规模二三维融合计算的挑战,本项目旨在深入探究并实施三项关键技术的研发: 1、空间数据融合:探索一种通用的技术框架,实现地理地图、街景图像、三维点云、地址文本等多种空间数据的融合,通过建立它们之间的关联,挖掘更深层次的空间特征(例如位置、方向、语义信息),以增强对复杂空间环境的表达与理解能力; 2、三维空间计算:研究并利用3D多模态大语言模型的潜能,使模型不仅能够定性分析场景的语义内容与空间结构(如依据图像进行地址描述、预测遮挡效果、执行碰撞检测),还能够进行精确的定量计算(如精确地理定位、精细几何尺寸计算),从而提升三维空间信息处理的深度与广度; 3、空间应用创新:基于上述二三维融合计算的核心技术突破,结合大语言模型的功能,探索并验证新型空间智能应用场景与服务模式,推动技术成果转化与行业应用创新。

更新于 2024-07-25杭州
logo of amap
实习高德研究型实习生

业务丰富,技术领先 高德打车算法团队深度赋能打车业务全链路,涵盖 用户增长、风控、服务管控、路线与上下车点推荐、ETA 预估、智能客服 等核心场景。多样化的业务挑战为算法创新提供了广阔的发挥空间,团队已在 AI 顶级会议发表成果。 精英阵容,国际视野 团队成员来自泰晤士世界大学排名 Top 10 的高校,以及美国常青藤、清华、北大等顶尖院校,兼具国际化背景与一流技术视野。 持续成长,共享共进 团队每周固定进行技术分享,氛围开放、互助友好;除了解答算法与工程难题,资深同事还会分享项目经验,并传授业务理解与问题解决的方法论,助你快速成长。 高德打车算法团队致力于用前沿AI技术重塑每一次打车体验。我们不是在做“推荐路线”,而是在理解用户为什么这样出行——他们偏爱哪条路?为何总在某个路口取消订单?哪些投诉背后藏着未被听见的需求? 我们正在寻找对用户行为洞察和大模型落地充满热情的实习生,与我们一起,用AI读懂出行的“潜台词”,让平台更懂你。 在这里,你将: • 构建用户出行偏好画像 基于海量行程数据,利用大模型(LLM)挖掘用户在路线选择、上下车点偏好、出行时段等方面的隐性行为模式,构建个性化出行画像,驱动个性化推荐与服务预判。 • 挖掘路线与上下车点的“隐藏特性” 分析亿级路线片段与上下车点的时空特征,通过大模型语义理解与多源信息融合,提炼可量化、可解释的“路段 / POI 质量标签”,优化点线相关推荐服务的质量。 • 提升投诉反馈的智能响应与信息透出能力 构建基于大模型的客诉理解与归因系统,自动识别投诉核心诉求(如“绕路”“司机态度”“等太久”),关联具体路线/上下车点/时段,生成结构化反馈报告,推动产品优化与客服话术升级,实现“从听抱怨到改体验”的闭环。 • 推动大模型技术在真实场景中的闭环落地 应用RAG、SFT、DPO、AI Agent等技术,构建可解释、可追踪、可迭代的智能系统,让模型不只是“跑得准”,更能“说得清、改得动、用得好”。 你的工作将直接服务全国数亿用户,每一次模型优化,都可能让一位用户少等5分钟、多一份安心、少一次投诉。你不是在写代码,你是在重塑人与出行之间的信任关系。

更新于 2025-09-25北京
logo of tongyi
实习通义研究型实习生

1、研究与算法实现: (1)参与图数据库代码知识图谱的构建与优化,借鉴最新的 RepoAudit 等研究成果。 (2)设计并实现基于强化学习(RL)的探索与反馈循环,包括智能体、动作空间、奖励机制。 (3)实验和优化多种RL策略(如PPO、DPO、GRPO、DAPO、GSPO)在真实图数据库测试场景的应用。 2、系统开发与实验: (1)构建可编译运行的图数据库测试平台,负责自动化测试流程(提出预言机→生成用例→执行验证→反馈奖励)的实现。 (2)针对开源图数据库(NeuG、Neo4j、RedisGraph、NebulaGraph等),验证并提交新型逻辑错误。 3、论文与成果输出: (1)参与撰写技术报告和学术论文,总结测试预言机生成的新方法与实验结果。 (2)协助开源端到端研究原型及技术文档的完善与维护。

更新于 2025-09-24北京|杭州
logo of amap
实习高德研究型实习生

【岗位亮点】 打造现象级AI产品:你的算法将服务数亿用户,利用行业最丰富的地理数据,扩展语义理解与路线生成的边界 前沿技术实践场:深度参与垂类多模态大模型的训练与优化,探索MLLM+地图理解的无限可能 真实场景大挑战:面对MLLM在地图任务下语义和空间的双重挑战,构建行业标杆级模型 【团队成就】 我们团队致力于构建下一代核心智能驾驶体验,在过去四年持续创造多个突破性创新产品技术。 智能出行开拓者:连续4年推出行业标杆产品,包括: 2022年 红绿灯倒计时黑科技 (拯救千万路怒症的神级操作) 2023年 V2X车车对话系统 (让汽车学会"社牛"沟通) 2024年 AI领航红绿灯 (比驾校教练更懂路的老司机) 2025年 TrafficVLM-Agent 上线 (高德地图“天眼”功能) 2025年 RouteVLM-Agent上线 (路线生成的无限可能) 【你将参与】 1. 用AI解锁出行新玩法:基于海量地图数据与用户场景,研发支持从“用户任意query”到一条“用户偏好&地理空间对齐的可行路线”的规划大模型 2. 打造行业领先的大模型应用:通过Prompt优化、SFT微调、强化学习等技术,让大模型真正理解复杂出行需求中的时空语义关系 3. 构建智能出行知识库:主导多模态数据处理,建立覆盖地图理解、实时路况分析、时空语义推理的千万级出行数据库 4. 定义未来出行方式:探索大模型在动态路线规划、智能交互导航等场景的突破性应用,持续输出行业领先的技术方案 【加入我们,你将获得】 与行业顶尖专家共事,参与日均百亿级请求的核心系统研发 完善的技术成长体系,包括大模型专项培训、季度技术workshop

更新于 2025-11-07北京