腾讯音乐技术研究-多媒体处理方向
任职要求
1.包括但不限于计算机、信息工程、模式识别、人工智能、自动化、软件工程、电子工程、统计学、应用数学、物理学/量子计算、信息安全、信号与信号处理等专业的硕士、博士; 2.有CV、DSP、ML、MIR、ASR、TTS等音频、图像、视频等多媒体技术方向研究或项目经验; 3.具备传统信号处理理论和实践,或熟悉应用深度学习常用模型,了解业界最前沿进展; 4.熟练应用c/c++/matlab,或熟练运用Tensorflow/Pytorch等工具。
工作职责
1.探索前沿机器学习技术在音频、图像、视频、多模态等多媒体技术方向的研究和应用; 2.基于多媒体技术提升用户体验及商业化实现; 3.推动多媒体新技术在QQ音乐/全民K歌等场景落地,或驱动新应用产生。
作为多媒体方向的研究工程师,你可以: 1、负责口语语言理解、用户意图理解、对话模型、人机对话、深度学习、深度强化学习等算法研究和开发; 2、负责语音识别/合成方向的技术研发工作,包括但不限于语音前端处理、声学模型/语言模型的建立、语言解码、语音合成(TTS)等; 3、负责针对对话交互的领域知识图谱建设和智能问答; 4、负责下一代视频编解码标准研究,负责视频编解码算法实现及优化; 5、负责语音识别/合成方向、前沿视频编码技术和前沿视频处理技术等问题的探索与研究,结合未来实际应用场景,提供全面的技术解决方案。
作为多媒体方向的研究工程师,你可以: 1、负责口语语言理解、用户意图理解、对话模型、人机对话、深度学习、深度强化学习等算法研究和开发; 2、负责语音识别/合成方向的技术研发工作,包括但不限于语音前端处理、声学模型/语言模型的建立、语言解码、语音合成(TTS)等; 3、负责针对对话交互的领域知识图谱建设和智能问答; 4、负责下一代视频编解码标准研究,负责视频编解码算法实现及优化; 5、负责语音识别/合成方向、前沿视频编码技术和前沿视频处理技术等问题的探索与研究,结合未来实际应用场景,提供全面的技术解决方案。
作为多媒体方向的研究工程师,你可以: 1、负责口语语言理解、用户意图理解、对话模型、人机对话、深度学习、深度强化学习等算法研究和开发; 2、负责语音识别/合成方向的技术研发工作,包括但不限于语音前端处理、声学模型/语言模型的建立、语言解码、语音合成(TTS)等; 3、负责针对对话交互的领域知识图谱建设和智能问答; 4、负责下一代视频编解码标准研究,负责视频编解码算法实现及优化; 5、负责语音识别/合成方向、前沿视频编码技术和前沿视频处理技术等问题的探索与研究,结合未来实际应用场景,提供全面的技术解决方案。