logo of 10jqka

同花顺数字人算法实习生

校招全职AI 算法类地点:杭州状态:招聘

任职要求


学历专业: 计算机科学、人工智能、信号处理、应用数学等相关专业的本科大三/大四或硕士/博士在读生。

编程基础: 熟练掌握Python编程语言,具备良好的代码风格和调试能力。

深度学习框架: 熟练使用至少一种主流深度学习框架,如 PyTorchTensorFlow。

理论基础: 对深度学习计算机视觉或语音信号处理有基本的理解,了解常见的神经网络架构(如CNN, RNN/LSTM, Transformer)。

…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


你将深入参与我们核心数字人产品的研发,主要负责让数字人的唇部动作与语音完美同步,提升虚拟形象的逼真度和自然度。具体工作包括:

数据准备与处理: 参与构建和清洗用于口唇驱动模型训练的高质量音视频数据集,包括数据标注、对齐和增强。

模型研发与优化: 协助研究员或工程师,参与基于深度学习的口唇驱动算法(如端到端模型、序列到序列模型等)的复现、训练、调优和评估。

效果评估与迭代: 使用客观指标(如唇读准确率)和主观评测,定量和定性分析模型生成的口唇动画效果,并提出改进方案。

技术调研与探索: 跟踪学术界和工业界在语音动画合成、计算机视觉、语音信号处理等领域的最新进展,并参与新技术原型的验证。

工具开发与支持: 可能参与开发或优化内部使用的数据处理、模型训练或效果可视化的工具链。
包括英文材料
学历+
Python+
深度学习+
PyTorch+
TensorFlow+
OpenCV+
还有更多 •••
相关职位

logo of baidu
实习ACG

-参与2d/3d数字人口型/表情驱动算法的研发优化工作 -参与2d数字人肢体驱动/交互算法的研发优化工作 -协助处理数字人业务相关工作 -持续跟进前沿aigc技术,探索数字人前沿算法

更新于 2025-01-15上海
logo of bytedance
实习A141523

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 1、负责2D/3D数字人、人体、服饰、口型、AI模特、商品等相关计算机视觉前沿技术的探索和研究; 2、负责图像/视频换装、实时视频生成、多模态数字人互动等相关计算机视觉前沿技术的探索和研究; 3、参与和推动上述相关技术在抖音、剪映等产品线的落地。

更新于 2025-02-13北京
logo of bytedance
实习A209034

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 1、负责2D/3D数字人、人体、服饰、口型、AI模特、商品等相关计算机视觉前沿技术的探索和研究; 2、负责图像/视频换装、实时视频生成、多模态数字人互动等相关计算机视觉前沿技术的探索和研究; 3、参与和推动上述相关技术在抖音、剪映等产品线的落地。

更新于 2024-07-11上海
logo of bytedance
实习A01505A

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 1、负责2D/3D数字人、人体、服饰、口型、AI模特、商品等相关计算机视觉前沿技术的探索和研究; 2、负责图像/视频换装、实时视频生成、多模态数字人互动等相关计算机视觉前沿技术的探索和研究; 3、参与和推动上述相关技术在抖音、剪映等产品线的落地。

更新于 2024-07-08杭州