
美图AIGC算法工程师-图像视频方向
任职要求
● 计算机科学、人工智能、机器学习或相关领域本科及以上学历 ●有Diffusion,VAR,Transformer至少一种生成式AI模型训练和微调实际项目经验 ●有丰富的ComfyUI工作流搭建和优化经验者优先 ●熟悉基础模型的训练和调试优先 ●具有较强的科研能力和创新精神,能够独立开展研究工作 ●在相关领域如CVPR/ICCV/SIGGRAPH/NeurIPS等顶级会议或期刊发表过论文者优先 ●有自我驱动力,勤奋好学 Location: Shenzhen Key Responsibilities ● Research and develop AIGC algorithms for highly controllable image editing, image-to-image, and image-to-video generation, including model architecture design, data processing, training optimization, performance evaluation, and inference acceleration ● Address project requirements including but not limited to photorealistic portrait generation, image stylization, image generation agents, and video VFX effects; collaborate with cross-functional teams to deploy solutions ● Track cutting-edge industry developments and proactively explore innovative technical approaches Qualifications ● Bachelor's degree or higher in Computer Science, Artificial Intelligence, Machine Learning or related fields ● Hands-on project experience in training and fine-tuning generative AI models (at least one of: Diffusion, VAE, or Transformer) ● Proven experience in building and optimizing ComfyUI workflows is preferred. ● Familiarity with foundation model training and debugging is preferred. ● Strong research capability and innovative mindset, able to conduct independent research. ● Prior publications in top-tier conferences or journals such as CVPR, ICCV, SIGGRAPH, or NeurIPS are highly desirable. ● Self-motivated, diligent and eager to learn
工作职责
美图影像研究院(MT Lab)专注于计算机视觉、深度学习与计算机图形学等前沿算法的研究与应用。我们为美图产品提供核心技术支持。团队汇聚顶尖人才,致力于推动影像技术的突破,让科技与艺术美好交汇。 MT Lab focuses on R&D of cutting-edge algorithms in CV, deepearning, and computer graphics. We provide core technicalsupport for Meitu products.Our team of top talent is dedicated to advancing imagingtechnology, beautifully merging science and art. 地点:深圳 岗位职责: ● 负责基于AIGC的高可控图像编辑、图生图、图生视频等算法研发,包括模型架构设计、数据处理、训练方法优化、性能评估和推理加速探索等 ● 负责但不限于真实人像生成,图像风格化,影像生成智能体和视频VFX相关效果需求,并与其他团队协作完成部署上线 ● 跟踪业界最新技术进展,积极探索和实践新的技术方案

1. 面向业务场景:互联网图文内容业务、视频内容业务及集团AI创新业务 2. 结合业务需求,在可控图像生成方向、可控图像编辑方向、可控视频编辑方向进行前沿工作的跟踪、研究及落地,并对业务进行技术引领和落地支撑

近年来,AIGC 技术在图像与视频生成方向取得了突破性进展,生成对抗网络、扩散模型以及多模态大模型的快速迭代,使视觉内容的创作方式发生了革命性变化。我们专注于探索生成式 AI 在视觉生成、虚拟内容创作和沉浸式体验中的前沿应用,致力于打造具备创意表达与真实感渲染能力的新一代图像与视频生成大模型。 随着模型在高分辨率生成、长视频建模与跨模态理解上的持续演进,如何进一步提升生成质量、控制力与效率,并将前沿技术落地到实际产品场景,是我们的核心研究方向。 如果你对生成式 AI、计算机视觉和视频生成充满热情,并希望参与构建下一代 AIGC 创作平台,欢迎加入我们,共同突破视觉生成的技术边界。 岗位职责 - 图像与视频生成算法创新:围绕GAN、VAE、Diffusion Models、Video Diffusion 等前沿技术,开展图像/视频生成、编辑、控制的算法研究与优化。 - 高分辨率与长视频建模:探索多尺度建模、时序一致性与跨帧约束方法,提升长视频生成的稳定性与沉浸感。 - 多模态融合与可控生成:设计跨模态联合建模方案,实现文本、图像、视频、语音等模态的协同生成与精准控制。 - 端到端研发闭环:参与或主导从数据构建、模型训练、性能评测到应用部署的完整研发流程。 - 前沿方向探索:紧跟 LLM、Diffusion Models、AR等前沿技术,推动 AIGC 在视觉生成领域的创新与落地。
1、负责3D能力与图像/视频生成结合的算法研发与优化,跟进三维视觉领域的前沿技术研究; 2、支持字节跳动各个产品线3D相关的业务需求; 3、跟进生成领域的新技术; 4、负责推动3D能力与视频生成相关技术落地于特效、视频编辑、商业化等领域的应用; 5、根据团队的整体目标和规划,进行相关的研发工作。
一、核心技术研发 1、主导视频大模型全周期开发(预训练/微调/推理),设计高效模型架构(如Diffusion/Transformer混合结构),优化训练策略与超参数调优; 2、突破多模态对齐技术难点,开发文本/图像/视频跨模态生成算法,提升生成内容的时序连贯性与物理合理性; 3、构建分布式训练框架,实现显存优化、梯度压缩等加速技术,完成千卡级集群的高效资源调度。 二、技术战略与小组统筹 制定文生视频(Text-to-Video)技术路线图,攻克高分辨率(4K+)、长视频(>1分钟)生成等工业级难题,能够统筹算法攻坚小组,协调模型研发、工程部署与产品落地的全流程协作。 三、行业前沿洞察 跟踪全球AIGC技术趋势(如Sora、Runway ML等),保持技术领先性,制定专利与论文策略。