通义研究型实习生- 多视角一致性3D高斯数字人生成技术

实习兼职通义研究型实习生2025-11-12地点：杭州状态：招聘

扫码手机上打开

任职要求

1. 计算机相关专业博士/硕士研究生，有激情、责任心强，具备良好的团队合作、沟通能力。
2. 有扎实的多模态或3D算法基础， 对3DGS、4DGS， 3D数字人生成及驱动相关技术研究感兴…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

本项目将探索基于单张图像或稀疏视角图像构建高保真，可交互的3D高斯（3D Gaussian Splatting）数字人，支持大角度相机视角切换与大幅度身体姿态变化，保持几何一致性与渲染稳定性。所生成的3D高斯数字人支持多模态实时驱动，实现自然流畅的面部表情和肢体驱动，打造低延迟、高真实感的沉浸式交互体验，为虚拟主播、远程会议、教育陪练、情感陪伴等高价值应用场景提供技术支撑。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

算法+

数字人+

CVPR+

还有更多 •••

登录查看完整学习资料

相关职位

计算机视觉算法实习生（三维人体重建与追踪方向）

实习算法类

无

更新于 2026-01-21

研究型实习生-多模态交互3D数字人的感知、重建及生成技术

实习通义研究型实习生

3D数字人的感知、重建与生成技术是多模态交互数字人、全息通讯、虚拟主播、情感陪伴等前沿应用的核心支撑。本项目旨在推动如下课题的技术攻关： 1、3D数字人感知研究：聚焦于利用多模态视觉语言模型、视频生成等先进方法，从单张图像或视频中高效、精准地提取数字人的表情与人体参数，提升数字人感知系统的准确度与鲁棒性。 2、3D数字人重建与生成研究：致力于结合文本、图像、视频等多模态数据与生成式大模型技术，推动从单图或多视角图像中重建并生成高质量3D数字人（如高斯泼溅、三维网格等）技术的发展，增强模型的写实性与表现力。同时探索实时多模态驱动与渲染技术，构建低延迟、高真实感的沉浸式交互体验，为多模态交互数字人、全息通讯、虚拟主播、情感陪伴等场景提供核心能力。

更新于 2025-11-18杭州

研究型实习生-稀疏视角下的体育场景重建与渲染

实习通义研究型实习生

NeRF&3D GS是很有潜力的新兴3D重建技术，这几年获得非常大的关注，有非常多的进展，但是实时训练和渲染一直是难以克服的问题。本项目拟通过快速、泛化NeRF、3DGS等方法，基于多视角图像的输入，在秒级时间内完内物体、场景重建和新视角图像渲染。

更新于 2024-11-14北京|杭州

研究型实习生-多模态通用运动表征技术研究

实习通义研究型实习生

专注于多模态通用运动表征技术的研究，具体职责包括： 1、构建一个多模态大模型框架，能够对现有多媒体素材中运动信息进行学习，输出在特定类目/物品在指定环境下运动规律的个性化表征； 2、基于上述运动表征，能够恢复、迁移到指定类目及场景下的运动效果，生成对应的视频素材； 3、模型能够拓展到通用物体场景，包含刚性/非刚性物体、被动/主动运动物体、相机视角变化/主体运动； 4、负责算法研发过程中的数据构建工作。

更新于 2025-05-08北京|杭州