影石感知算法工程师-数据服务方向
任职要求
1.本科或以上学历,计算机/人工智能相关专业,具备良好的英文文献检索和阅读能力 2.具有扎实的数学基础,精通多视几何、计算机视觉、机器人等基础知识 3.具有SLAM/SFM/双目深度/3DG…
工作职责
1. 负责单目/双目深度 和 3D跟踪 的真值系统方案设计、实施和数据生产 2. 负责测试数据挖掘,包括用sfm、3dgs、离线大模型等生成伪真值标签 3. 搭建benchmark系统,制定合适的测试用例、评价指标等来评价算法性能,加快算法迭代效率
1.主导亿级用户规模的高德个性化推荐场景优化,应用机器学习、深度学习、LLM以及AIGC技术,提升推荐结果的相关性、多样性和用户体验 2.负责多入口多场景下的统一推荐算法优化,在召回、粗排、精排、混排等核心模块中,应用业界领先的算法和技术,实现多场景建模、跨场景知识迁移和端到端优化;针对用户行为序列建模、时空场景推荐等关键技术点,探索结合LBS数据特点的创新算法,攻克跨域行为融合、冷启动时空优化、动态供需匹配等业务难题,显著提升推荐系统的关键指标 3.探索前沿技术方向,推动技术创新;研究并落地最新的推荐算法和技术方向,包括但不限于:大模型驱动的生成式推荐(如LLM-based推荐);基于LLM的用户长短期兴趣建模与跨场景迁移学习;结合RAG的上下文感知推荐与个性化内容生成(AIGC);时空建模与多模态融合推荐;强化学习(RL)在推荐系统中的实践与优化。
我们正在寻找在具身智能VLA(视觉-语言-动作)、空间计算(重建、SLAM等)及强化学习领域有深厚积累的算法同学,加入高德地图视觉技术中心。你将参与构建下一代地图中的感知、理解与决策系统,推动具身导航、AR/VR、场景建模等前沿技术的研发与落地。 如果你热衷于用AI改变人们出行方式,渴望在真实世界大规模数据上验证算法能力,欢迎加入我们! 岗位职责: ● 负责视觉语言动作(VLA)的具身智能模型和视觉语言模型(VLM)的研发,提升具身agent的空间理解和行动决策能力; ● 推进空间计算相关技术(如SLAM、三维重建、点云处理、姿态估计等)在下一代地图、虚拟现实等场景的应用; ● 探索强化学习在多模态大模型的后训练中的应用,提升具身/空间智能的能力天花板; ● 跟踪国际前沿技术发展,持续推动技术创新,并落实到实际应用中; ● 与工程团队紧密协作,完成从算法研发到系统部署的全流程闭环。
我们正在寻找在具身智能VLA(视觉-语言-动作)、空间计算(重建、SLAM等)及强化学习领域有深厚积累的算法同学,加入高德地图视觉技术中心。你将参与构建下一代地图中的感知、理解与决策系统,推动具身导航、AR/VR、场景建模等前沿技术的研发与落地。 如果你热衷于用AI改变人们出行方式,渴望在真实世界大规模数据上验证算法能力,欢迎加入我们! 岗位职责: ● 负责视觉语言动作(VLA)的具身智能模型和视觉语言模型(VLM)的研发,提升具身agent的空间理解和行动决策能力; ● 推进空间计算相关技术(如SLAM、三维重建、点云处理、姿态估计等)在下一代地图、虚拟现实等场景的应用; ● 探索强化学习在多模态大模型的后训练中的应用,提升具身/空间智能的能力天花板; ● 跟踪国际前沿技术发展,持续推动技术创新,并落实到实际应用中; ● 与工程团队紧密协作,完成从算法研发到系统部署的全流程闭环。
我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 1、负责研发空间智能核心技术,进行室内/室外/航拍/卫片等全场景高质量空间理解、重建与生成,包括但不限于基于图像、视频、点云、Mesh和3DGS等多种模态数据的空间智能基座与应用; 2、负责多模态大模型和视频生成大模型的预训练、微调等工作,包括但不限于数字人、生成式重建及空间生成等应用方向; 3、负责大规模多模态数据集的构建、清洗与管理,搭建高效数据流水线,保障算法训练与评估; 4、负责结合具体需求,抽象出关键算法进行研发,并持续保持及引领相关技术指标。