快手AIGC多模态数据系统研发工程师/专家
任职要求
1、本科以上学历,计算机相关专业,3年以上后端系统开发经验; 2、有AIGC数据工程相关经验者优先;有多模态数据经验者优先; 3、熟悉linux操作系统及开发环境,至少精通Python/Java等一门编程语言,具备编写高效数据处理代码的能力; 4、熟悉Flink/Hive/H…
工作职责
1、面向AIGC行业的基础模型领域,完成多模态大数据系统和核心组件的架构和开发; 2、设计并维护覆盖大模型多模态数据全生命周期的数据系统,包括数据采集,挖掘,构造,分析和价值验证等; 3、理解AIGC的数据需求和逻辑,建设智能高效的数据挖掘手段,实现海量多模态数据的有效治理和数据效果高效转化。
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的AI大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、多模态引擎研发:研发融合文本、视觉、语音的角色类大模型,优化角色生成的真实性与情感表达(如虚拟助手、游戏NPC、互动剧角色),突破多模态对齐、长期记忆、行为一致性等技术难点; 2、极致性能优化:超大规模模型的分布式训练优化,提升角色类模型的推理效率与资源利用率,指令微调、偏好对齐、数据增强等技术的场景化创新; 3、业务场景落地:支持豆包、猫箱等产品的角色生成需求,覆盖对话、创作、教育等场景,探索角色模型在智能硬件、元宇宙等领域的沉浸式交互能力; 4、前沿探索:研究人格化模型在情感计算、社会常识推理等方向的突破,定义AI角色从「功能执行」到「人格化陪伴」的技术范式。
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、多模态引擎研发:研发融合文本、视觉、语音的角色类大模型,优化角色生成的真实性与情感表达(如虚拟助手、游戏 NPC、互动剧角色),突破多模态对齐、长期记忆、行为一致性等技术难点; 2、极致性能优化:超大规模模型的分布式训练优化,提升角色类模型的推理效率与资源利用率,指令微调、偏好对齐、数据增强等技术的场景化创新; 3、业务场景落地:支持豆包、猫箱等产品的角色生成需求,覆盖对话、创作、教育等场景,探索角色模型在智能硬件、元宇宙等领域的沉浸式交互能力; 4、前沿探索:研究人格化模型在情感计算、社会常识推理等方向的突破,定义AI角色从「功能执行」到「人格化陪伴」的技术范式。
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、负责多模态大模型的研发和应用,研究相关技术在豆包、智能助手、智能硬件等领域的全新应用和解决方案,包括而不限于多模态理解生成,视觉Agent等能力,研发以人工智能技术为核心的新技术、新产品; 2、探索超大规模模型,进行极致系统优化; 3、数据建设、指令微调、偏好对齐、模型优化; 4、相关应用落地,包括看图对话、问答、搜索、生成创作、逻辑推理、代码生成等; 5、在未来生活中的更多使用场景的深入研究和探索,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式。