快手算法实习生-【AIGC多模态内容生成】
任职要求
1、对基于图像、视频、语音、文本等模态内容的各类算法有一定的理解,并在如下一个或多个相关方向有深入研究:GAN 、扩散模型、图像生成、多模态、LLM等; 2、具备扎实的编程功底,熟悉 Pytorch 等主流深度学习框架,熟练使用 C ++/ …
工作职责
1、参与多模态生成算法的调研和分析,如Diffusion Models 、 GAN 、 VAE 、 Autoregressive Models等,包括但不限文本/图像/视频生成,解决生成质量、多样性、可控性、采样效率、可编辑等问题; 2、参与多模态生成算法的基础模块的研发,如 VAE、CLIP、LLM 等; 3、协助多模态生成算法的效果分析、数据优化、行业调研 等。
1.负责AIGC多模态大模型相关的算法模块的研发、架构设计、模型后训练、数据构建和效果评估等工作,包括各模态tokenizer设计,数据合成策略,以及跨模态融合后训练策略等,参与实现游戏领域定制化的文生图像/视频、图像/视频理解和编辑等多模态大模型的技术落地; 2.参与文本、代码、图像、视频等多模态内容的生成与理解相关算法研发与优化,熟悉包括RAG技术栈和Code理解/生成技术栈等,并支撑相应算法高效落地到游戏的各管线及工作流中; 3.进行大模型reasoning能力的相关算法探索,研究SFT/GRPO/self-play等技术,提高模型在游戏引擎代码库等场景涉及的推理任务上的表现,参与落地游戏领域具有业务问题解決能力的agent; 4.跟进大模型、多模态、强化学习、智能体的前沿算法技术研究,支持强化学习在游戏 bot 中的算法落地应用,把握AIGC生成技术的最新前沿技术发展趋势。
1. 研发面向用户增长场景的多模态大模型,包括文本、音频、图像、视频等多模态数据的理解与生成; 2. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 3. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品,如抖音、今日头条、番茄小说、西瓜视频等APP的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 1、探索3D-AIGC技术前沿,对相关算法做优化与创新; 2、提升3D内容生成质量、速度、多样性、可控性等; 3、挖掘业务潜在需求,结合业务场景,设计并实现算法方案; 4、发表相关技术创新成果。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品,如抖音、今日头条、番茄小说、西瓜视频等APP的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 1、探索3D-AIGC技术前沿,对相关算法做优化与创新; 2、提升3D内容生成质量、速度、多样性、可控性等; 3、挖掘业务潜在需求,结合业务场景,设计并实现算法方案; 4、发表相关技术创新成果。