腾讯腾讯视频-影视AIGC高级算法研究员(视频生成/编辑方向)-(深圳)(杭州)
任职要求
1.计算机科学、人工智能或相关专业硕士及以上学历; 2.精通 Python,熟练掌握 PyTorch等深度学习框架,comfyui的使用,具备优秀的代码能力和工程实现能力; 3.具备扎实的深度学习基础,对diffusion、强化学习等AI技术有深刻的理解; 4.熟悉HunyuanVideo、wan2.2/2.5、SkyReels V2等视频生成模型,熟悉VACE、wan-animate等视频编辑模型; …
工作职责
1.负责针对影视任务(如影视后期编辑、ai视效、ai短剧等)视频生成与编辑领域核心算法的研究与开发,涵盖 Text-to-Video、Image-to-Video、Video Editing、视频理解生成统一模型、image/video relighting、3D生成等技术方向; 2.针对影视工业的高标准需求,攻克生成视频的"AI感"、时序细节一致性、画质细节等关键问题; 3.探索并落地生成内容的精细化控制方案,提升模型输出的艺术表现力与商业可用性; 4.紧跟学术界与工业界最新研究进展,快速复现并评估 SOTA 算法,结合影视业务场景进行创新性改进,推动前沿技术向生产力转化; 5.与产品、工程、内容创作团队紧密协作,将算法能力转化为实际产品功能。
一、核心技术研发 1、主导视频大模型全周期开发(预训练/微调/推理),设计高效模型架构(如Diffusion/Transformer混合结构),优化训练策略与超参数调优; 2、突破多模态对齐技术难点,开发文本/图像/视频跨模态生成算法,提升生成内容的时序连贯性与物理合理性; 3、构建分布式训练框架,实现显存优化、梯度压缩等加速技术,完成千卡级集群的高效资源调度。 二、技术战略与小组统筹 制定文生视频(Text-to-Video)技术路线图,攻克高分辨率(4K+)、长视频(>1分钟)生成等工业级难题,能够统筹算法攻坚小组,协调模型研发、工程部署与产品落地的全流程协作。 三、行业前沿洞察 跟踪全球AIGC技术趋势(如Sora、Runway ML等),保持技术领先性,制定专利与论文策略。
1、产品战略与规划: 深入洞察AIGC行业趋势、用户需求和竞争格局,负责AI图像生成模型及相关应用功能(Web & App)的中长期产品规划和迭代路线图; 2、核心功能与体验设计: 负责AI图像生成核心功能的完整生命周期,通过提升模型的可控性、表现力和易用性,系统性地优化用户创作体验,并探索与定义前沿的AI原生交互模式; 3、一体化工作流构建: 规划并推动图像与视频生成工作流的深度整合方案,打造连贯、高效的一体化创作体验,构建平台的核心竞争壁垒; 4、模型效果定义与驱动: 与算法团队紧密协作,将用户场景和产品需求,转化为清晰、可量化的模型效果评估标准。通过建立评测体系和反馈闭环,持续驱动算法模型在美学、可控性、真实感等方面的迭代精进; 5、数据驱动与用户洞察: 深度挖掘用户行为数据,结合定性/定量的用户研究和A/B测试,科学地评估产品表现,精准洞察用户核心意图与痛点,发现增长机会并驱动产品决策; 6、跨团队协同与项目管理: 作为项目核心,高效地与算法、工程、设计、运营、法务等团队沟通协作,确保产品高质量、按时交付,并达成预期的业务和数据目标。
职位描述 作为引擎客户端方向的开发工程师,你将参与构建支撑 AIGC 内容生成的底层基础设施,确保数据生成的高效性与稳定性。具体职责包括: 1. 自动化高效渲染平台开发:基于虚幻引擎开发并维护 AIGC 大规模数据合成平台。实现场景自动搭建、参数动态控制、多机分布式渲染及批量离线输出等功能,构建从场景到视频数据的高效管线; 2.渲染性能深度优化:针对大规模视频渲染需求,深入引擎底层,优化渲染管线、Lumen 及光线追踪的执行效率,平衡画质与生成速度; 3.核心需求功能扩展:基于 UE 底层模块,实现影视级自动布光、智能相机运镜、多人动作交互等高级逻辑,提升数据生成的保真度与多样性; 4.工具链与稳定性建设:为技术美术和算法人员开发高效的 API 与工具,解决高并发生产环境下的内存泄漏与引擎崩溃等稳定性难题。