阿里巴巴算法工程师-三维重建和生成
任职要求
【必备项】 1、本科及以上学历,计算机视觉、计算机图形学、机器学习等相关专业; 2、具备计算机图形学和计算机视觉理论基础,熟悉几何重建、NeRF建模、可微渲染、Diffusion、Gaussian Splatting、3DGS场景生成等相关领域技术; 3、具备极佳的工程实现能力,熟练掌握C+…
工作职责
如果你,渴望参与结合视频生成等大模型技术的3D模型编辑技术研究,包括3D数字人妆容编辑、发型编辑、服饰编辑等涉及3D高稳定性以及一致性的编辑算法; 如果你,渴望参与Physical AI、3D场景生成等结合视频大模型以及3D生成技术的前沿技术研究,包括将图像转换可自由探索的3DGS场景,将视频转换成连续视角、可交互的空间视频等WFM算法; 如果你,渴望参与结合3D先进信息的视频生成大模型技术研究,包括结合3D数字人实现姿态、表情可控的短视频生成等; 那还犹豫什么,赶紧加入我们吧,你将与来自不同部门的优秀人才合作,不仅能够获得专业的培训和指导,还可以在工作中不断挑战自我,在职业生涯中不断成长和发展,享受工作中的乐趣和成就感。来吧,我们等你加入!
主要职责: (图像识别 三维重建经验 51word toC 袋鼠 数字孪生 新能源汽车) 1. 三维建模技术研究,包括NeRF建模、可微分几何建模、3D Gaussian Splatting建模算法等; 2. 负责非限定场景下的高精度相机位姿估计研究,包含COLMAP算法、SLAM算法等; 3. 负责3D Diffusion相关技术研究,包括多模态3D AIGC、材质生成等; 4. 负责隐式三维模型编辑相关技术研究,包括模型压缩、材质&光照解耦、显式&隐式模型融合等。 5. 负责通过人工智能的方式,提升过程效率和自动化程度,降低人工参与的成本,参与其他相关业务的 AI算法研发、数据处理、模型训练、模型调优和训练流程自动化;
1、负责研发图像及点云数据的室内、室外等多场景的高质量三维重建算法 2、负责3d算法研究和落地,包括但不限于深度估计、SLAM、MVS、SFM、Nerf、3dgs等 3、负责隐式三维模型理解、生成、编辑相关技术的研究和探索
我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 1. 多模态大模型研发与应用 负责多模态大模型的核心架构设计,研究并实现图片、视频、文本等跨模态特征对齐、融合与表征学习方法,负责多模态大模型的数据准备、高效训练(包括但不限于预训练、SFT、强化学习等)、推理加速等。 2. 模型优化与小型化部署 负责多模态大模型的轻量化设计、压缩与加速,确保模型在端侧设备上的高效运行。 针对高德地图的实际业务场景,优化模型性能,平衡精度与效率。 3. 创新性研究与落地 跟踪端侧生成式AI(Edge Generative AI)、强化学习(PPO、GRPO等)、智能Agent等前沿技术,探索多模态大模型在自动驾驶、智能导航等领域的潜在应用。 将研究成果快速转化为实际产品功能,推动技术创新与业务增长。