通义研究型实习生-稀疏视角下的体育场景重建与渲染
实习兼职通义研究型实习生地点:北京 | 杭州状态:招聘
任职要求
1. 博士/硕士研究生,计算机、数学等相关专业优先。
2. 有扎实的3D视觉、深度学习理论基础,对MVS、NeRF、3DGS相关技术研究感兴趣。
3. 在计算机…登录查看完整任职要求
微信扫码,1秒登录
工作职责
NeRF&3D GS是很有潜力的新兴3D重建技术,这几年获得非常大的关注,有非常多的进展,但是实时训练和渲染一直是难以克服的问题。本项目拟通过快速、泛化NeRF、3DGS等方法,基于多视角图像的输入,在秒级时间内完内物体、场景重建和新视角图像渲染。
包括英文材料
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
相关职位
实习通义研究型实习生
本项目将探索基于单张图像或稀疏视角图像构建高保真,可交互的3D高斯(3D Gaussian Splatting)数字人,支持大角度相机视角切换与大幅度身体姿态变化,保持几何一致性与渲染稳定性。所生成的3D高斯数字人支持多模态实时驱动,实现自然流畅的面部表情和肢体驱动,打造低延迟、高真实感的沉浸式交互体验,为虚拟主播、远程会议、教育陪练、情感陪伴等高价值应用场景提供技术支撑。
更新于 2025-11-12杭州
实习研究型实习生
研究领域: 人工智能 项目简介: 本课题面向大模型推理特别是长序列(包括prompt和CoT reasoning)进行软硬协同、深入优化探索。 1. 大模型推理需求:大模型推理的模型规模和序列长度增长迅速,模型规模面向千亿至万亿参数,序列长度面向64K或更长。 2.软硬协同深入优化空间:包括从算法到算力、访存、通信等到分布式,以应对大规模、长序列在线推理的挑战。
北京|杭州
实习阿里云研究型实习
文本检索广泛应用于行业搜索、全文检索、RAG(检索增强生成)等细分业务场景。 文本检索在召回侧由传统的稀疏文本匹配逐渐发展成向量化表示的稠密检索,以及稀疏稠密的混合检索,整体的检索效果也持续保持增长,仍有大量提升空间。 在排序侧,由于已经召回了高质量结果,仅仅需要对少量top k结果做重排序,可以用query与doc联合输入的cross attention架构Rerank模型,大幅提升最终的检索效果。
更新于 2024-07-25杭州