快手AIGC视觉生成研发实习生
任职要求
1、实习至少4-6个月,现场实习,地点北京,具备快速学习新技术、跟踪最新文献能力; 2、熟悉Stable diffusion等主流工具流程,包…
工作职责
1、负责AIGC视觉生成、视觉编辑等相关算法研发,包括并不限于文生图、参考图生成、图像可控编辑、视频生成编辑研发方向; 2、提出和实现前沿算法,支持AIGC视觉模型研发、效果优化及在快手各场景落地应用,保持算法在工业界和学术界的领先,支持相关专利、顶会论文工作发表。
团队介绍:快手商业智能生成团队主要负责快手商业化AIGC & Agent和多模态生成式推荐,研发的AI视频、AI小说等已在广告场景大规模落地并带来规模化收入,制定中国通信标准化协会AI视频生产标准;研发的多模态理解和大模型推荐技术,为商业化大盘带来显著提升。团队在 CVPR、ICCV、ICML、ICLR、AAAI等Al顶会发表多篇研究成果。 1、负责AIGC视觉生成方向的算法探索和落地开发,包括但不限于视频生成、图像编辑、文生图等; 2、参与基础模型的框架设计、预训练以及面向实际应用优化等,重点解决低成本、高品质生成、多样性以及可控编辑等关键问题; 3、紧跟学术前沿,深入研究视觉生成模型设计和优化的创新方法,全面提升视觉生成模型的生成效果; 4、发表高水平学术论文,提升团队在学术界、工业界的技术影响力。
1、研究和探索可控的视觉内容生成技术,负责视觉内容生成模型等相关算法的研发和落地,结合公司业务场景进行相关策略迭代; 2、探索时空内容可控生成技术,包括图片/视频风格迁移、镜头控制、空间一致性控制等; 3、持续跟踪图像和视频生成领域的最新技术动态,评估并实施前沿技术,推动技术在公司产品中的应用与创新。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:国际商业化产品与技术团队支持字节跳动国际产品的广告产品与变现技术。我们负责end2end的大型广告系统建设,为客户提供商业推广方式与方案。我们的团队遍布北京、上海、美国、新加坡等地,在这里你将有机会开阔自己的国际化视野,接触到全球领先的商业产品架构、模型和算法,并有机会参与并推动互联网广告行业的创新和变革。 1、负责商业化广告业务的文案、图片、视频等创意自动化生成相关研发工作,探索并应用GPT、Diffusion等模型生成高质量商业化内容,赋能商业化场景创意制作及优化; 2、参与GPT&Diffusion等生成式模型相关算法研发与优化,跟进计算机视觉和自然语言处理领域的前沿技术研究; 3、追踪业界语言模型、视觉生成、多模态及Generative AI方向最新技术,针对业务场景及问题设计创意算法解决方案,并落地相关自动化创作及优化能力。