字节跳动3D生成算法工程师-豆包大模型
任职要求
1、教育背景:计算机科学、电子工程、图形学、计算机视觉或相关领域的硕士或博士学位; 2、专业技能:具有3D视觉相关背景,熟悉3D生成和重建技术;有3D生成/重建项目经验者优先;工程能力强,能够独立完成项目开发和优化;具有图形学背景者优先,熟悉3D图形渲染和建模技术;熟悉3D建模软件(例如Blender,Maya,C4D,ZBrush)或引擎(例如Unity,UE)者优…
工作职责
1、3D生成任务处理和模型训练:参与3D生成相关的研究项目,设计和实现高效的3D生成算法;设计和实施3D生成模型的训练方案,优化模型性能;进行实验和测试,评估模型的效果和性能;研究和应用最新的3D生成技术和方法,保持技术的前沿性;与团队合作,解决3D生成过程中遇到的技术难题; 2、3D数据处理:处理和分析各种类型的3D数据;开发和优化3D数据处理工具和算法,以提高数据处理效率和质量;维护和管理3D数据集,确保数据的完整性和一致性。
团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、负责豆包模型AIGC相关技术的研究和开发,包括图像、视频或3D生成&编辑等,探索基于扩散和自回归的技术路线,以实现高质量的输出; 2、解决生成视频/图像中的时间一致性、空间连贯性和可控性等核心研究难题; 3、紧跟生成方向(扩散模型、Transformer、生成对抗网络等)的最新研究动态,并对创新想法进行原型验证; 4、依托公司和业界的大模型和基础CV技术,构建面向ToB业务应用的多模态算法能力,帮助业务取得成功。
团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、负责豆包模型AIGC相关技术的研究和开发,包括图像、视频或3D生成&编辑等,探索基于扩散和自回归的技术路线,以实现高质量的输出; 2、解决生成视频/图像中的时间一致性、空间连贯性和可控性等核心研究难题; 3、紧跟生成方向(扩散模型、Transformer、生成对抗网络等)的最新研究动态,并对创新想法进行原型验证; 4、依托公司和业界的大模型和基础CV技术,构建面向ToB业务应用的多模态算法能力,帮助业务取得成功。
团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 1、参与3D视觉与多模态生成结合的相关算法研发与优化,包括3D生成、视频生成等,跟进计算机视觉领域的前沿技术研究; 2、参与和推动上述相关技术在抖音、剪映、火山引擎等产品线的落地。