荣耀AIGC图像视频生成算法工程师
任职要求
1、数学/物理/自动化/计算机/电子工程/人工智能等相关专业; 2、掌握计算机视觉原理知识,熟练使用CNN、Transformer等架构,掌握图像视频生成基础算法者优先,包括但不限于GAN、VAE、Diffusion等; 3、具备优秀的编码能力及扎实的数据结构/算法功底,掌握至少一种常用的深度学习框架(Pytorch/TensorFlow/Caffe),具…
工作职责
1、负责AIGC图像视频生成前沿技术的研究,保持行业领先水平,持续突破技术上限; 2、负责AIGC图像视频生成算法的开发与性能提升; 3、提出和实现最前沿的算法,保持算法在工业界和学术界的领先。
1、负责vivo影像“AI视效”及各类影像创作类生成式影像前沿研究与算法应用,打造极致且有趣的影像产品,持续迭代优化核心算法模型及整体技术框架,支撑前沿技术产业落地; 2、与产品团队紧密合作,将最新的生成式AI技术融入公司产品和服务中,显著提升用户体验和满意度; 3、不断优化现有算法,提高效果、性能和稳定性,确保技术在各种设备和平台上的高效运行,发布研究成果,积极参与行业会议,与学术界和工业界建立并维护良好的合作与交流关系。

近年来,AIGC 技术在图像与视频生成方向取得了突破性进展,生成对抗网络、扩散模型以及多模态大模型的快速迭代,使视觉内容的创作方式发生了革命性变化。我们专注于探索生成式 AI 在视觉生成、虚拟内容创作和沉浸式体验中的前沿应用,致力于打造具备创意表达与真实感渲染能力的新一代图像与视频生成大模型。 随着模型在高分辨率生成、长视频建模与跨模态理解上的持续演进,如何进一步提升生成质量、控制力与效率,并将前沿技术落地到实际产品场景,是我们的核心研究方向。 如果你对生成式 AI、计算机视觉和视频生成充满热情,并希望参与构建下一代 AIGC 创作平台,欢迎加入我们,共同突破视觉生成的技术边界。 岗位职责 - 图像与视频生成算法创新:围绕GAN、VAE、Diffusion Models、Video Diffusion 等前沿技术,开展图像/视频生成、编辑、控制的算法研究与优化。 - 高分辨率与长视频建模:探索多尺度建模、时序一致性与跨帧约束方法,提升长视频生成的稳定性与沉浸感。 - 多模态融合与可控生成:设计跨模态联合建模方案,实现文本、图像、视频、语音等模态的协同生成与精准控制。 - 端到端研发闭环:参与或主导从数据构建、模型训练、性能评测到应用部署的完整研发流程。 - 前沿方向探索:紧跟 LLM、Diffusion Models、AR等前沿技术,推动 AIGC 在视觉生成领域的创新与落地。
1. 负责深度学习、生成式模型在图像与视频生成领域的研发与优化,包括文本生成图像(text-to-image)、文本生成视频(text-to-video)、图像/视频编辑等。 2. 研究并实现前沿的生成模型架构(如 Diffusion Models、GAN、Transformer、NeRF 等)以及多模态融合技术(文本、音频、视频、图像)。 3. 结合业务需求,设计和训练高质量的生成模型,提升生成结果的真实感、美学质量、语义一致性和可控性。 4. 建立数据采集与清洗流程,构建高质量的训练、微调和评估数据集(涵盖图像、视频、多模态)。 5. 设计、实现并维护模型推理服务,包括模型部署、性能优化、成本控制和稳定性保障。 6. 对生成模型的评测指标进行研究和完善,包括自动化评分、用户反馈收集、强化学习奖励函数等。 7. 跟进计算机视觉、生成式AI、多模态领域业界及学术新技术,并快速验证和落地。