vivo图像AIGC算法专家(北京&杭州&上海)
任职要求
1、熟悉计算机视觉和图像处理基本算法和常用的深度学习算法,并在如下一个或者多个方向有较为深入的研究:文生图大模型、图生图、可控生成技术(controlnet)、图像质量评估、强化学习(RLHF,DPO等)等。 2、具备扎实的编程功底,熟悉Pytorch等主流深度学习框架。 3、具备良好的分析和解决问题的能力,工作积极主动,自驱力强。 4、有文生图大模型或者图像相关的强化学习(RLHF | RLAIF | DPO)经验者优先。 5、有图像质量评估,图像美学评估经验者优先。
工作职责
1、负责基于AIGC技术、多模态技术和强化学习技术打造移动影像下一代计算成像算法架构,对最终效果竞争力负责。 2、负责基于上述架构的核心图像算法的规划、预研与商用落地。负责核心数据资产的构建。 3、跟踪和探索AIGC方向研究前沿,识别学术界/业界优秀研究资源,进行技术合作,实现图像内容生成和增强方向上关键新技术的长期布局和突破。
团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 1、负责多模态/GAN/SD等生成相关算法研发与优化,跟进计算机视觉领域的前沿技术研究; 2、参与技术规划制定,把握图像、视频生成技术最新发展趋势; 3、推动技术在特效/素材生成/辅助设计等领域的应用。
1、负责基于AIGC技术、多模态技术和强化学习技术打造移动影像下一代计算成像算法架构,对最终效果竞争力负责。 2、负责基于上述架构的核心图像算法的规划、预研与商用落地。负责核心数据资产的构建。 3、跟踪和探索AIGC方向研究前沿,识别学术界/业界优秀研究资源,进行技术合作,实现图像内容生成和增强方向上关键新技术的长期布局和突破。
1、负责多模态生成算法研发,如Diffusion Models 、 GAN 、 VAE 、 Autoregressive Models等,包括但不限文本/图像/视频生成,解决生成质量、多样性、可控性、采样效率、可编辑等问题; 2、负责端到端多模态生成式大模型的框架设计、训练与调优,构建基于生成模型的AI系统,推动多模态AIGC在快手各业务场景的产品化落地; 3、负责百亿/千亿参数量的多模态生成大模型研发,实现关键技术突破,并将前沿算法技术转化为创新产品。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责AIGC基础模型相关技术的研究和开发,包括图像、视频或3D生成&编辑等; 2、向字节跳动内部产品提供基础模型,及相关应用的支持; 3、探索以人工智能技术为核心的新产品。