
美图计算机视觉/数据实习生(深圳)
任职要求
美图影像研究院(MT Lab)专注于计算机视觉、深度学习与计算机图形学等前沿算法的研究与应用。我们为美图产品提供核心技术支持。团队汇聚顶尖人才,致力于推动影像技术的突破,让科技与艺术美好交汇。 MT Lab focuses on R&D of cutting-edge algorithms in CV, deepearning, and computer graphics. We provide core technicalsupport for Meitu products.Our team of top talent is dedicated to advancing imagingtechnology, beautifully merging science and art. 岗位名称:计算机视觉/数据实习生 工作地点:深圳 研究方向一 1.计算机视觉和机器学习; 2.多模态的图片及视频生成; 3.数据分析,质量监控和数据处理。 职位描述 1.搭建并运行生成式模型的推理流程,用于多样化视频数据的生成; 2.参与设计和渲染合成视频场景,提升数据的多样性与覆盖度; 3.开发自动化脚本和工具,支持数据生成、处理和结构化管理; 4.协助构建高质量视频数据集,为后续的模型训练与评估提供支持; 5.与团队成员协作,解决模型与数据相关的问题,并进行实验性分析与对比。 职位要求 ●学历背景 ○计算机/电子信息/数学或相关专业的硕士生,或特别优秀的本科生。 ●必备条件 ○熟练掌握 Python 编程,了解常见深度学习框架(尤其是PyTorch)。 ○有实际计算机视觉或生成模型相关经验(项目 / 实习均可)。 ○有一定阅读理解英文文献论文以及沟通的能力。 ○能够独立阅读相关文献,跑通开源 GenAI 模型,具备调试和实验能力。 ○有责任心和项目所有权意识,积极主动。 ○具备良好的问题解决能力,沟通能力和实验记录习惯。 ○一周可实习5天,至少可以实习3个月。 ●加分项 ○掌握C/C++,有AI辅助编程工具使用经验。 ○有计算机图形仿真或3D 引擎使用经验(即使是课程或个人项目)。 ○熟悉视频处理工具链。 ○了解数据集构建流程,例如数据标注、组织、质量控制等等。 ○有视频特效、生成式媒体相关创作经验。 研究方向二: 1. 图像及视频生成(Diffusion / Autoregressive Models) 2. 计算机视觉(Detection, Segmentation, Editing, etc.) 3. 多模态模型(VLM) 4. 基于LLM/VLM的数据处理(visual understanding,video captioning,etc.) 5. 数据爬取 职位描述: 1. 验证当前SOTA的视频生成模型能力(如prompt following,temporal consistency等); 2.利用AI模型(如LLM,VLM),ComfyUI工作流以及图像处理技术处理大规模数据的清理,筛选,打标,预处理等; 3.发现目前数据处理流程中的问题,提出改进意见,实现并验证优化的流程与算法; 4.探索基准和指标以验证数据质量; 5. 和不同的团队沟通来解决模型和数据上的相关问题。 职位要求: 1. 有责任心和项目所有权意识,积极主动; 2. 快速理解复杂问题,解构复杂问题,处理复杂问题的能力; 3. 优秀的抗压和沟通能力,能够在快速的环境中迅速适应; 4. 有一定阅读理解英文文献和论文的能力; 5. 计算机/电子信息/数学相关专业,本科(特别优秀)及以上学历; 6. 掌握C/C++/Python至少一种,有AI辅助编程工具使用经验者优先; 7. 熟悉常用CV库和深度学习框架(PyTorch/TensorFlow等); 8. 基础扎实,对计算机视觉和人工智能研究和落地有热情; 9. 一周可实习5天,至少可以实习3个月。
工作职责
无

美图影像研究院(MT Lab)专注于计算机视觉、深度学习与计算机图形学等前沿算法的研究与应用。我们为美图产品提供核心技术支持。团队汇聚顶尖人才,致力于推动影像技术的突破,让科技与艺术美好交汇。 MT Lab focuses on R&D of cutting-edge algorithms in CV, deepearning, and computer graphics. We provide core technicalsupport for Meitu products.Our team of top talent is dedicated to advancing imagingtechnology, beautifully merging science and art. 岗位名称:计算机视觉实习生 工作地点:深圳 主要岗位方向: ● 计算机视觉和机器学习 ● 多模态的图片及视频生成 ● 数据分析,质量监控和数据处理 岗位职责: ● 搭建并运行生成式模型的推理流程,用于多样化视频数据的生成 ● 参与设计和渲染合成视频场景,提升数据的多样性与覆盖度 ● 开发自动化脚本和工具,支持数据生成、处理和结构化管理 ● 协助构建高质量视频数据集,为后续的模型训练与评估提供支持 ● 团队成员协作,解决模型与数据相关的问题,并进行实验性分析与对比
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、负责图像与视频的内容理解与生成相关算法模型研发与优化,跟进计算机视觉领域的前沿技术研究; 2、负责图像与视频生成模型基座的训练和优化,提升生成效果能力的高美观度和可控度; 3、负责图像与视频的内容理解算法的训练和优化与在抖音各场景的应用研发与落地。

1、参与图像匹配/图像分类算法的调研、评估、设计和适配性改进工作 2、参与目标检测/目标追踪算法的调研、评估、设计和适配性改进工作 3、参与人体姿态估计算法的调研、评估、设计和适配性改进工作
小鹏机器人中心致力于研发先进的人形机器人技术,包括机器人的行走,操作,智能导航,在大语言模型支撑下的人机交互等。我们拥有世界一流的软硬件团队,分布于深圳,上海,北京,广州和北美。作为计算机视觉和多模态大模型领域实习生,你将和机器人中心相关领域的工程师共同解决科研和工程问题。我们将共同成长,在人形机器人前沿领域留下自己印记。 你将获得: • 最前沿的AI相关技术,包括端到端导航,视觉和多模态基础大模型训练,推理,数据获取,机器人平台的应用部署等。 • 行业专家的指导。对于优秀的工作,我们会鼓励和帮助文章发表或专利申请。 • 完备的实验室条件, 包括充分的计算资源,机器人硬件平台等。 • 实习生是公司的宝贵财富,对于即将毕业的优秀的实习生,我们会优先考虑其全职工作申请。