logo of ztgame

巨人网络视觉研究型算法实习生

实习兼职实习生地点:上海状态:招聘

任职要求


1)在校硕士、博士,人工智能、计算机科学专业、视频生成研究方向优先;
2)熟悉扩散模型、VAE、世界模型等相关研究进展;
3)具备出色的编程能力,精通Pyt…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


聚焦探索实时可交互视频生成方向,产出高水平学术成果与影响力技术落地。

专项课题:
研究方向一:实时视频生成范式探索
1. 实时视频生成范式的探索,系统性验证AR或AR+Diffusion视频生成方案;
2. 尝试垂直领域AR生成范式和AR生成范式在数据上的scaling law和智能涌现能力;
3. DiT视频生成效率提升,包括但不限高效率、低精度损失、高压缩比的视频VAE和tokenizer、包括稀疏架构、MoE等DiT结构探索。
研究方向二:长视频生成的一致性保持
1.DIT范式,AR范式 和 AR + DiT范式下的视频生成记忆框架实现与调研,包括但不限于3D 世界模型表征记忆,预测帧缓存与重用机制 和 用户状态与意图记忆等;
2.基于隐式视觉记忆机制(跨时间追踪关键环境状态),探索无需显式3D建模的动态场景表征,支持对场景物体、光照、环境的长期记忆存储与检索。
包括英文材料
Python+
C+++
还有更多 •••
相关职位

logo of quark
实习日常实习生

千问学习团队致力于通过大模型技术构建智能学习产品,在大模型Posttrain技术、推理智能、agentic、coding等方向处于业界前沿 1. 负责大模型Posttrain阶段强化学习算法关键问题的探索研究,持续追踪和应用领域最新技术进展; 2. 负责大模型落地训练范式和关键技术的探索研究,包括DeepReaserch,Agentic Reasoning,奖励模型建模等; 3. 负责多模态大模型预训练、跨模态对齐、推理等领域的关键问题的探索和研究,包括视觉编码器、视觉推理等、多模态语料构建方法等; 4. 基于研究成果撰写高质量学术论文,积极参与业界交流活动,建立和维护学术界与产业界的合作关系。

更新于 2026-03-23北京|广州
logo of xiaohongshu
实习大模型

【职位描述】 我们是小红书安全风控平台部/算法策略组/内容安全组,目前专注于多模态大模型在多模态理解和内容安全场景的技术落地和产品预研,目前在相关数据&技术方向有一定的积累,并将长期持续投入。我们希望寻求优秀在读硕士生/博士生共同突破大模型在安全审核行业落地的技术挑战,作为实习生,你将有机会与产品、工程紧密合作,将研究算法应用到实际问题中,并解决有难度有价值的问题,促进领域前沿技术的发展。欢迎投递简历。该岗位的核心研究方向包括但不限于: 1. 基础多模态表征:主要研究小红书多模态数据(笔记)下的基础多模态表征工作,包括层次化表征、特征融合、自监督探索等,作为基础模型,支持多样化检索场景。 2. 通用多模态大模型:通用多模态大模型在安全领域理解相关研究,包括高效微调、多模态理解等。建立安全多模态基础模型。

北京
logo of amap
实习高德研究型实习生

团队介绍: 我们团队在地图导航的核心领域路线规划、ETA、路况预测等方向都达到行业领先的水平,有很强的用户口碑,你将与算法精英共事,提升你的技术实力和创新能力。团队承接公司核心业务,深耕人工智能前沿领域,在业内有持续影响力,多篇论文入选paper digest最有影响力论文名单。 具体职责包括但不限于: 1、在mentor的指导下,研究用于图像和视频生成/理解的先进算法,包括但不限于GANs和LDMs、多模态大模型; 2、跟踪业内最前沿的AIGC和多模态大模型技术,并将创新技术用于实际问题; 3、技术沉淀形成顶会论文和专利。

更新于 2025-03-27北京
logo of amap
实习高德研究型实习生

一、团队介绍 高德视觉技术中心为高德业务提供全面的核心视觉技术,是高德时空互联网领域重要的技术驱动力。我们专注于图像识别、点云识别、三维重建和传感器融合定位等领域, 我们致力于研究和开发业内领先的感知、SLAM、重建和多模态大模型等算法, 促科技创新,与生态共进,连接真实世界,做好一张活地图,让出行和生活更美好! 通过视觉技术中心的春季实习生项目,高校学生通过此项目可以接触到高德真实的业务场景和海量时空大数据,在优秀的前辈与高德技术人交流学习中加速成长。我们希望更多优秀的高校同学加入我们,一起打造极致的算法和产品体验。 二、基本要求 面向预期于26、27届毕业的同学,可以连续实习至少三个月的同学优先。实习地点:北京,我们将提供有竞争力的实习薪酬和充足的训练资源。 三、算法实习生 职位描述 团队主要聚焦视觉、矢量地图、多模态大模型技术,我们期待你的工作将覆盖以下至少一个技术方向: 1. 探索自动驾驶场景下的在线感知、建图、关联等前沿技术,包括但不限于矢量地图构建、矢量地图关联等; 2. 探索多模态大模型在下游任务中的技术能力,包括但不限于图文对齐/识别、跨模态理解生成、多模态检索、VLM端到端自动驾驶、世界模型等;

更新于 2025-03-27北京