字节跳动算法实习生-AIGC
任职要求
1、2026届硕士及以上学位在读; 2、自然语言处理、计算机视觉方向、推荐算法、广告算法、搜索算法等方向优先;或者大模型领域,主导过大影响力的项目或论文者优先; 3、熟悉CV相关的算法和技术,熟悉3D视觉的基本知识,熟悉VAE,Diffusion等生成式模型; 4、熟悉NLP相关的算法和技术,熟悉业界领先的大语言模型(Qwen系列,LLaMA1/2/3,Yi系列…
工作职责
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:游戏-AIGC部门,致力于将生成式AI落地到游戏中,包括但不限于模型、贴图、动画、场景、剧情、对话、玩法等游戏核心元素的AI生成和AI提效。部门近几年一直在游戏AI和数字人方向持续深耕,欢迎海内外优秀学子加入。 1、包括但不限于3D生成模型和多模态模型优化,3D数据分析,几何结构优化等; 2、包括但不限于动作生成模型优化,动作数据分析,自动重定向,自动绑定等; 3、包括但不限于LLMs方向的数据建设、指令微调、偏好对齐、模型优化; 4、包括但不限于游戏NPC智能对话交互,肢体动作生成,游戏剧情生成等应用落地。
我们是网易云音乐算法团队,专注于行业领先的搜索或者推荐算法,我们致力于通过技术赋能云音乐各项业务,通过社区广场推荐,提升用户体验,产生商业化价值。 在这里你可以: 1、参与云音乐各场景相关的AIGC算法应用,使用NLP、多模态、LLM等技术,优化包括多模态内容理解、大模型交互式对话、大模型AI创作生成等业务应用的效果提升; 2、参与云音乐创新业务相关的算法优化,使用业界领先的深度学习、强化学习、图模型等,优化推荐、直播、声音、社交等业务的算法; 3、参与前沿的基础算法模型建设,包括继续预训练、视频生成微调,音乐生成训练等垂类基座模型的构建和应; 4、接触到亿级别海量、真实的用户数据,使用深度学习、强化学习、图模型等算法,发挥推荐的价值; 5、使用行业领先的大规模分布式机器学习平台,例如tensorflow等开源的工具,实现并不断优化推荐、搜索等算法。
目前主流的素材混剪能力主要依赖于素材的端内容理解、表征匹配、高光检测等能力帮助一键完成整个视频剪辑过程,偏模板化,且预定义较为死板,无法支持更丰富的信息量注入,以及用户自主输入剪辑要求。 本课题希望通过大语言模型的语义指令解析能力,开放基于可自定义prompt的视频编辑能力,通过指令分解、协同主题文案生成的方式,帮助完成带有故事感文案生成能力的视频剪辑功能。主要的技术难点包括: 1、多模态理解与表征:需要模型能够深入理解不同模态内容(视频片段、图像、音频)的语义和上下文; 2、时序理解与编辑:视频混剪需要理解时序信息,包括情节发展、节奏感、转场点等; 3、文案生成和改写:可自定义主题、风格的素材文案生成能力。
1. 基于 AIGC 研发虚拟换衣(Virtual Try-On)与虚拟化妆(Virtual Makeup)方向算法, 实现业界/学术界前沿生成技术 2. 与产品设计团队紧密合作,推动算法快速落地,提升用户体验 3. 深度参与模型调优、数据构建、效果评估等端到端研发流程 4. 鼓励创新与研究产出,支持在顶会(CVPR / ICCV / ECCV / SIGGRAPH / NeurIPS / ICML 等)投稿