
美图三维视觉算法实习生(图像 / 视频美型)
任职要求
关于团队 我们是一个聚焦人体美型与前沿三维视觉探索的视觉研发团队,专注于人物影像理解、三维重建与智能美型等核心技术方向。团队融合学术研究方法与真实产品落地,持续探索 AI 在人像图片与视频生成编辑、时空一致性建模及三维结构理解中的新边界。 岗位概览 你将参与美图人物美型与时空稳定编辑技术的研究与实现,直接接触真实产品级数据与前沿算法,实习时长3-6个月,base悉尼。基于实习方向,内容可能包括但不限于: - 图像 / 视频精细化美型与可控编辑 - 2D / 3D 人像追踪与三维重建 - 人体数字模型(如 SMPL)的回归重建与结构约束 该岗位可同时产出真实落地的产品能力与高质量科研论文成果,是一个研究与工程紧密结合的实习机会,适合对三维视觉基础、人像视觉质量提升、视频生成模型及三维人体建模等方向具有强烈兴趣与能力的同学。 实习时长6个月以上,base悉尼,支持远程。 你将会负责三维人体重建追踪方向的研究,包含: 参与现有卷积神经网络美型方法的测试与评估 参与应用算法的微调,训练与实验结果讨论分析 改进算法网络,包括美型细节(局部形变/体态修正)方法的设计 提供算法Demo,并与产品及其他研发团队协作,确保算法效果,并推动项目落地 后期可参与Diffusion扩散模型等AIGC类大数据生成项目 我们期待你—— 博士在读,计算机、人工智能、智能艺术等相关专业 熟悉 P…
工作职责
无
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:作为一家拥有自主创新和研发创造能力的科技品牌,PICO致力于成为领先的世界级XR平台,成就开发者与创作者,共同为全球消费者创造更美好的生活体验。我们开创性地将虚拟现实扩展到了多个领域,为运动、视频、娱乐等消费级场景带来了全新体验;并广泛应用在教育、医疗和企业培训等商用场景,给全球企业级用户提供了多元化的VR解决方案。 1、负责AR/MR场景中业界领先的端上图像或三维视觉相关深度学习算法研究与应用(2D/3D检测/分割/深度估计等),推进前沿技术在AR/MR场景的工业落地; 2、探索云端检测、分割、深度估计大模型在数据生产,模型蒸馏,端云结合上的应用;研发高效的MLOPs算法生产工具链;完善算法生产的基础设施建设; 3、探索CV,Vision-LLM,AIGC在AR/MR场景中的技术预研与落地。
1. 负责平面/全景的影像 AIGC 前沿技术探索与研究,包括但不限于:平面/全景图像/视频生成与编辑、视频生成与一致性建模、图像生成与增强等。 2. 推动 AIGC 技术产品化落地:围绕真实场景数据与产品链路,将研究原型转化为可上线能力。 3. 将大模型能力与 AIGC 影像模型融合,增强产品功能与交互体验:探索并落地“大模型 + 影像生成/编辑”的组合方案。 岗位亮点和吸引点: 1. “帮助人们更好地记录和分享生活”,你的工作成果将进入无人机全景产品链路,帮助提升真实用户的拍摄、编辑与内容生产效率。 2. 全景是下一代“沉浸式内容”的底座,是从“平面影像”走向“空间影像”的关键形态。AIGC在全景域的能力成熟后,可显著提升内容生产效率与质量上限,长期应用空间广。 3. 全景能力与空间视频、VR/AR、机器人导航感知、数字孪生、地图与三维重建等方向强相关;在这里积累的“空间一致性”与“生成式系统”能力具备长期技术迁移价值。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 1、调研和实现三维视频,VR相关算法,并将算法优化迭代到业务可用; 2、跟进前沿的光场重建,VR,动态重建相关技术,并进行相关创新。