
美图计算机视觉实习生(世界模型方向)
任职要求
● 计算机/电子信息/数学相关专业,基础扎实,硕士及以上学历 ● 熟练掌握C/C++/Python至少一种,工程实现能力强 ● 熟悉常用CV库和深度学习框架(PyTorch/TensorFlow/Caffe等) ● 对计算机视觉和人工智能研究和落地有热情 Title: Computer Vision Intern Location: Beijing Core Technical Domains: Deep learning, computer vision, and image & video processing, with specific focus on technologies including but not limited to: image/video detection, recognition, segmentation, editing, reconstruction, 3D vision, computational imaging, image generation, AIGC, and multimodality. Key Responsibilities: 1、Theoretical Innovation ● Conduct in-depth research on cutting-edge technologies within the domain, proactively propose innovative concepts and solutions, and be responsible for drafting technical patents or academic papers. 2、Algorithm Design ● Target specific practical application scenarios, design tailored algorithms, and conduct systematic optimization to enhance the algorithms' performance, operational efficiency, and robust…
工作职责
美图影像研究院(MT Lab)专注于计算机视觉、深度学习与计算机图形学等前沿算法的研究与应用。我们为美图产品提供核心技术支持。团队汇聚顶尖人才,致力于推动影像技术的突破,让科技与艺术美好交汇。 MT Lab focuses on R&D of cutting-edge algorithms in CV, deepearning, and computer graphics. We provide core technicalsupport for Meitu products.Our team of top talent is dedicated to advancing imagingtechnology, beautifully merging science and art. 岗位名称:计算机视觉实习生 工作地点:北京 涉及技术方向:深度学习/计算机视觉/图像视频处理, 如图像和视频的检测、识别、分割、编辑、重建、3D视觉、计算成像、图像生成、AIGC、多模态等 岗位职责: ● 理论创新:研究领域最新技术,提出新idea,撰写技术专利或论文 ● 算法设计:针对实际应用场景,设计算法并提升其效果/效率/鲁棒性 ● 落地实现:核心代码实现,输出demo或SDK,根据产品反馈迭代优化
1.前沿技术探索与落地:参与多模态理解、生成式模型、强化学习等前沿技术的应用研究,协助进行多模态模型的数据建设、指令微调、偏好对齐等工作,协助团队进行技术验证和原型开发。 2.多模态 Agent 能力探索:支持多模态交互的基础能力研发,探索多模态 RAG、视觉 CoT、多模态 Agent 等进阶能力;参与 GUI/游戏等虚拟世界的通用多模态 Agent 项目的研究工作。 3.数据建设与评测体系:参与数据质量评估、标注标准制定及自动化数据 Pipeline 的搭建与维护,参与图像/视频理解评估、世界模型评估方法的实验。
1、多模态数据挖掘:基于 VLM 开展自动驾驶场景理解与行为挖掘,实现复杂场景、行为模式及 corner case 自动识别发现,探索弱监督 / 自监督 / 提示工程应用,提升高价值训练数据挖掘效率; 2、数据向量化建模与分布挖掘:研究数据 Embedding 建模方法,构建场景 / 行为 / 轨迹向量空间,实现数据分布建模、长尾场景发现与覆盖度评估,设计高效数据采样、重加权与主动挖掘算法; 3、数据合成与场景重建:基于 3D Gaussian Splatting、世界模型、NeRF 等技术实现真实场景重建,生成高真实性仿真数据与 corner case 合成数据,探索世界模型与数据生成在数据闭环中的应用; 4、数据闭环系统算法研发:负责自动驾驶数据挖掘、筛选、评测与训练数据构建闭环系统,推动算法研究原型工程化落地,并在真实数据中完成效果验证。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动Seed团队成立于2023年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代AI交互等、在中国、新加坡、美国等地设有实验室和岗位。 Seed团队在AI领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的AI研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过50个应用场景。 1、参与大模型机制的基本研究,方向包括但不限于大模型可解释性、可控性;Agent的世界认知、任务规划、自我认知;Multi-Agent的协作与对抗; 2、持续追踪大语言模型/多模态大模型等方向的前沿技术。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与研发前沿算法,发表国际顶级论文、申请专利; 2、深入调研和关注大语言模型/多模态大模型等方向的前沿技术,应用解决业界实际问题的机会以及经验; 3、良好的团队氛围,丰富的计算和数据资源。