百度数字人算法实习生(J93055)
任职要求
-计算机或相关专业在读 -有AIGC、数字人、GAN、Diffusion、视频生成等方向的实践经验优先,对数字人方向有一定了解 -熟练掌握python,熟悉PyTorch/TensorFlow…
工作职责
-参与2d/3d数字人口型/表情驱动算法的研发优化工作 -参与2d数字人肢体驱动/交互算法的研发优化工作 -协助处理数字人业务相关工作 -持续跟进前沿aigc技术,探索数字人前沿算法

你将深入参与我们核心数字人产品的研发,主要负责让数字人的唇部动作与语音完美同步,提升虚拟形象的逼真度和自然度。具体工作包括: 数据准备与处理: 参与构建和清洗用于口唇驱动模型训练的高质量音视频数据集,包括数据标注、对齐和增强。 模型研发与优化: 协助研究员或工程师,参与基于深度学习的口唇驱动算法(如端到端模型、序列到序列模型等)的复现、训练、调优和评估。 效果评估与迭代: 使用客观指标(如唇读准确率)和主观评测,定量和定性分析模型生成的口唇动画效果,并提出改进方案。 技术调研与探索: 跟踪学术界和工业界在语音动画合成、计算机视觉、语音信号处理等领域的最新进展,并参与新技术原型的验证。 工具开发与支持: 可能参与开发或优化内部使用的数据处理、模型训练或效果可视化的工具链。
-参与2d/3d数字人口型/表情驱动算法的研发优化工作 -参与2d数字人肢体驱动/交互算法的研发优化工作 -协助处理数字人业务相关工作 -持续跟进前沿aigc技术,探索数字人前沿算法
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 1、负责2D/3D数字人、人体、服饰、口型、AI模特、商品等相关计算机视觉前沿技术的探索和研究; 2、负责图像/视频换装、实时视频生成、多模态数字人互动等相关计算机视觉前沿技术的探索和研究; 3、参与和推动上述相关技术在抖音、剪映等产品线的落地。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 1、负责2D/3D数字人、人体、服饰、口型、AI模特、商品等相关计算机视觉前沿技术的探索和研究; 2、负责图像/视频换装、实时视频生成、多模态数字人互动等相关计算机视觉前沿技术的探索和研究; 3、参与和推动上述相关技术在抖音、剪映等产品线的落地。