腾讯腾讯视频-AIGC算法研究员-(深圳)(杭州)
任职要求
1.计算机、人工智能、数学等相关专业的全日制本科(优先),研究生及以上学历; 2.具有扎实的计算机视觉或机器学习算法基础,有相关方向顶级论文者优先; 3.熟练掌握机器学习和深度学习的基本原理,熟悉常见的生成模型组件和框架,包括 GAN、VAE、Transformer、Diff…
工作职责
1.通过对生成模型(图像/音视频/多模态/3D视觉等)的研究,解决目前算法在生成质量、多样性、可控性、生成效率等上的问题,探索生成模型的突破性技术; 2.从事图像/音视频/多模态/3D视觉领域算法模型的训练和研发,应用于腾讯视频相关的内容创作和用户体验提升; 3.结合自有产品和业务需求,从生成模型迭代、可控模块研发,性能加速等方面优化模型,解决面向业务场景的应用和落地时的关键算法问题,并最终有效改善用户体验和生产效能,协助算法的产品化落地。
1.负责针对影视任务(如影视后期编辑、ai视效、ai短剧等)视频生成与编辑领域核心算法的研究与开发,涵盖 Text-to-Video、Image-to-Video、Video Editing、视频理解生成统一模型、image/video relighting、3D生成等技术方向; 2.针对影视工业的高标准需求,攻克生成视频的"AI感"、时序细节一致性、画质细节等关键问题; 3.探索并落地生成内容的精细化控制方案,提升模型输出的艺术表现力与商业可用性; 4.紧跟学术界与工业界最新研究进展,快速复现并评估 SOTA 算法,结合影视业务场景进行创新性改进,推动前沿技术向生产力转化; 5.与产品、工程、内容创作团队紧密协作,将算法能力转化为实际产品功能。
1.负责AI Lab语音技术团队语音技术,包括TTS、语音压缩编码、语音前端处理等,尤其是基于AIGC算法的基础研究和应用落地。 ; 2.侧重于研发语音合成、语音转换、few-shot / zero-shot TTS、音频和音乐生成等先进算法尤其是生成类算法,并且可以融合语音识别、音频分析、语音增强、语音分离等更广泛的语音/音频任务。将有关算法成果应用于语音 / 音乐 / 音效/音频生成、语音翻译(S2TT、S2ST)、虚拟人等众多场景中。 ; 3.通过跟踪和创新,确保算法方面的行业领先,通过打造语音技术PAAS平台服务于腾讯内部各个业务场景包括游戏、社交、内容服务、广告、金融、车载助手、企业服务(如腾讯会议、企业微信、企点客服、商通、数智人)等等,帮助业务产生实际价值和打造业界领先的语音应用产品。; 4.持续关注学术界和行业的最新研究动态,参与国际会议、研讨会,与全球顶级团队进行交流合作。。
1.研发新一代3D资产生成大模型,突破生成质量、速度与可控性的技术边界; 2.构建工业级3D AI生成管线,解决几何拓扑优化、材质贴图生成、物理合理性等核心问题。