字节跳动大模型算法工程师(视频/图片创作)-剪映CapCut(北京/上海/杭州/深圳/广州)
任职要求
1、优秀的代码能力、数据结构和基础算法功底,熟练掌握至少一门语言,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先; 2、熟悉NLP、CV、ML等相关的技术,深入理解大模型或图片视频生成等相关技术栈(如RLHF、SFT、Dit/Vit/Transformer等); 3、在大模型领域,主导过大影响力的项目或论文者优先;…
工作职责
1、负责视频/图片创作营销Agent相关的研发和应用,研究高质量数据的挖掘和合成、大模型的对齐效率、多目标融合的学习,Agent全链路优化的方法等等,期望以大模型影响整个创作者生态; 2、高质量数据挖掘清洗对齐,多领域的数据自动合成方法,Self-instruct等探索; 3、全模态大模型(文本、图像、语音)的Post-training算法,探索多模态感知能力的边界; 4、结合LongCOT/RL等进行Agent的全链路自主探索学习,并探索跟应用目标融合的学习方式; 5、结合业务把技术转化成线上产品,影响千千万万的视频、图片创作者。
1、负责即梦AI创作Agent的搭建和优化,主导全链路工程系统架构和数据建模,使用PE/SFT/RL/RAG等技术调优Agent效果,提升创作Agent能力上限,沉淀领域知识数据,构建行业领先的创作Agent; 2、探索业界前沿LLMOps、图片/音频/视频多模态理解,持续优化Agent效果和性能。
团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 1、探索研究多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、基于通用大模型,结合创作垂类应用场景,进行相关的数据建设、指令微调、偏好对齐、模型优化,升数据合成、模型推理 & 规划能力,构建全面客观准确的评测体系,探索提升垂类大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建以智能创作为核心的多模态AI Agent;推动相关的新技术、新产品落地。
1、负责视频/图片创作营销Agent相关的研发和应用,研究高质量数据的挖掘和合成、大模型的对齐效率、多目标融合的学习,Agent全链路优化的方法等等,期望以大模型影响整个创作者生态; 2、高质量数据挖掘清洗对齐,多领域的数据自动合成方法,Self-instruct等探索; 3、全模态大模型(文本、图像、语音)的Post-training算法,探索多模态感知能力的边界; 4、结合LongCOT/RL等进行Agent的全链路自主探索学习,并探索跟应用目标融合的学习方式; 5、结合业务把技术转化成线上产品,影响千千万万的视频、图片创作者。