优酷日常实习生-视觉生成算法实习生
任职要求
1、人工智能、计算机及相关相关专业博士或硕士在读,在视觉生成、计算机视觉、多模态等领域基础扎实 2、代码能力扎实 ,熟练掌握PyTorch开发,有PyTorch分布式训练经验 3、熟悉生成模型(VAE,Diffusion Models,DiT) 4、对于生成相关技术有热情,热衷于探索前沿技术,渴望做出好的成果 5、自驱力强,具备良好的团队合作精神,性格积极乐观
工作职责
1、研究和探索可控的视觉内容生成技术,负责视觉内容生成模型等相关算法的研发和落地,结合公司业务场景进行相关策略迭代 2、探索时空内容可控生成技术,包括图片/视频风格迁移、镜头控制、空间一致性控制等 3、持续跟踪图像和视频生成领域的最新技术动态,评估并实施前沿技术,推动技术在公司产品中的应用与创新
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:智能创作团队是字节跳动创作场景业务中台,负责了抖音、剪映等产品的技术和业务研发,涵盖了计算机视觉、深度学习、高性能计算、图形学、特效引擎等技术领域,并以多种形式向公司内部各业务线提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案,同时通过火山引擎为企业客户提供服务。 1、参与多模态生成/GAN/SD等图像生成相关算法研发与优化,跟进计算机视觉领域的前沿技术研究; 2、参与技术规划制定,把握图像生成技术最新发展趋势; 3、推动技术在特效/素材生成/辅助设计等领域的应用。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、建立下一代多模态模型评测体系,引导模型向AGI的方向发展:创建针对推理与交互的下一代多模态模型评测Leaderboard,包括而不限于长视频高帧率评估、视频流式交互评估、视觉COT评估、世界模型评估方法,GUI/游戏等虚拟世界的通用多模态Agent评估方法; 2、探索多模态大模型能力边界:追踪业界对于模型能力的边界拓展进程,持续迭代复杂度更高的评测集合,防止基准测试饱和模型过拟合; 3、优化评测工程链路与评测手段:探索自动化评测任务构造和自动化评估方法,提升模型评测效率。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:国际化短视频 machine learning团队,负责国际化短视频的基础推荐算法,直接为国际化短视频的核心用户体验负责。我们的工作内容包括大规模推荐算法的优化、复杂约束的优化问题的解决、CV/NLP等多个学术领域的算法改进以及对多种场景的推荐架构的设计和对产品数据的复杂深入的分析。在这里,你可以深入钻研机器学习算法的改进和优化,探索前沿的技术;可以跟来自全球不同国家的团队合作,感受不同文化的碰撞, 激发认知;可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、负责计算机视觉前沿技术的研究与国际化业务落地,聚焦内容理解相关技术在各业务中的探索与应用,实现技术的创新与业务指标的增长; 2、负责跟进并实现计算机前沿技术,并进行前瞻性的技术研究; 3、主要研究方向包括:多模态预训练、图片和视频的生成、图片和视频风格迁移、跨模态检索、大模型多标签分类、半监督学习、自监督学习。