米哈游【实习】视频生成强化学习算法工程师
任职要求
1、硕士及以上学历,计算机科学、电子工程、人工智能等相关专业; 2、2年以上图像/视频生成、强化学习或其他计算机视觉相关领域工作经验; 3、具备出色的编程与算法实现能力,熟练掌握主流深度学习框架(如 PyTorch),并拥有熟练的模型训练与调优经验; 加分项 1、熟悉扩散模型及其不同变体,如 Score Model、DDPM、DDIM、Flow Matching 等,了…
工作职责
负责视频生成模型在后训练/强化学习阶段的算法研发与模型训练,运用前沿强化学习算法优化模型的稳定性与视频生成质量,并实现对人类专家审美偏好的深度对齐。 核心职责 1、深入研究前沿强化学习算法,负责视频生成任务中的基于强化学习的优化方案探索及训练框架搭建; 2、结合视频生成模型的效果短板,分析强化学习算法的优化目标,设计数据收集方案; 3、设计并实现面向视频生成的多目标强化学习算法,设计并训练奖励模型(Reward Model); 4、撰写高质量技术报告与论文,与团队共同推动技术创新,保持行业领先地位。
团队介绍:广告业务原为商业产品与技术部门,为抖音集团的商业变现提供广告产品与技术,负责端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,践行"激发生意新可能"理念,致力于让营销更省心、更高效、更美好,推动商业的可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里,你将投身建设面向未来的数字营销能力,接触到全球先进的商业产品架构、模型和算法,在互联网广告行业始终创新。 课题介绍: 1、核心技术架构: 1)下一代广告技术栈: 模型算法层:搭建基于强化学习的智能出价与流量预估系统,攻克深层转化场景下的数据稀疏、多源异构数据融合(延迟数据/埋点噪声/跨平台行为)等行业难题; 系统工程层:构建支持基于长序列特征的实时预估框架,研发支持动态创意组合的自动化投放引擎; AIGC融合层:建立文/图/视频多模态生成技术中台,实现从IP素材生成到智能投放的全链路闭环; 2)行业首创的AIGC解决方案: 正在搭建全球领先的"小说→漫剧"智能生产线,攻克三大技术堡垒: 多模态叙事引擎:研发支持角色一致性保持(Character-aware Diffusion)、分镜自动生成(Storyboard LLM)、动态运镜控制(Camera ControlNet)的复合型生成框架; 工业化工作流:构建支持分布式渲染、多版本AB测试、合规性审核的智能生产管线,实现日均千级素材产能; 投放增效系统:开发生成质量量化评估模型(QAGAN),建立素材生成-投放效果的反哺优化机制; 2、岗位挑战: 你将主导: 构建支持沿模型的混合推理框架,优化多卡并行下的生成效率; 设计跨模态对齐算法,提升文字指令到视觉元素的可控生成精度; 研发基于用户行为分析的智能素材变异系统,实现CTR提升30%+的个性化内容生成; 打造从内容生产到实时竞价的全自动化广告引擎; 3、我们期待这样的开拓者: 精通Diffusion Models技术栈,具有LoRA/ControlNet/T2I-Adapter等微调框架的实战调优经验; 熟悉多模态大模型(如VideoPoet、Sora等视频生成技术原理),具备跨模态表征学习研究背景; 拥有广告算法背景者优先,熟悉CVR预估、智能出价等核心模块与生成式AI的结合点; 出色的工程化能力,主导过至少一个完整AIGC项目的端到端落地(从模型训练到服务部署)。
1、参与推进火山方舟的大模型、多模态、文本理解、生成算法、强化学习等下一代人工智能技术; 2、关注和推进相关技术在业务场景的落地,包括但不限于知识库问答、语音助手、Text2Code、摘要和指令抽取、角色扮演、智能创作等; 3、深入跟踪调研大模型以及相关方向(包括但不限于NLP/CV/多模态/具身智能)的前沿技术。
1、参与推进火山方舟的大模型、多模态、文本理解、生成算法、强化学习等下一代人工智能技术; 2、关注和推进相关技术在业务场景的落地,包括但不限于知识库问答、语音助手、Text2Code、摘要和指令抽取、角色扮演、智能创作等; 3、深入跟踪调研大模型以及相关方向(包括但不限于NLP/CV/多模态/具身智能)的前沿技术。