logo of tencent

腾讯技术研究-多媒体处理方向

实习兼职Pre留学生实习地点:深圳 | 北京 | 上海状态:招聘

任职要求


1、包含但不限于计算机、信息工程、模式识别、人工智能、自动化、软件工程、电子工程、统计学、应用数学、物理学/量子计算、信息安全、信号与信息处理等专业的博士和优秀硕士;
2、熟练掌握至少一种编程语言,包括但不限于JavaC/C++C#Python等;
3、有声学、语音信号背景知识、语音识别、分离、合成、说话人识别与日志研发经验;或熟悉HEVC/AVS2等视频编码标准,有VVC或者AVS3标准研究经验,具有扎实的图像、视频处理基础。

加分项
在学术会议ICASSP、INTERSPEECH、ISCSLP、ASRU、JVET、iWAENC、WASPAA、AES Convention和期刊以第一作者发表过文章,有丰富项目经验。

工作职责


作为多媒体方向的研究工程师,你可以:
1、负责口语语言理解、用户意图理解、对话模型、人机对话、深度学习、深度强化学习等算法研究和开发;
2、负责语音识别/合成方向的技术研发工作,包括但不限于语音前端处理、声学模型/语言模型的建立、语言解码、语音合成(TTS)等;
3、负责针对对话交互的领域知识图谱建设和智能问答;
4、负责下一代视频编解码标准研究,负责视频编解码算法实现及优化;
5、负责语音识别/合成方向、前沿视频编码技术和前沿视频处理技术等问题的探索与研究,结合未来实际应用场景,提供全面的技术解决方案。
包括英文材料
模式识别+
Java+
C+
C+++
C#+
Python+
语音识别+
相关职位

logo of tencent
实习实习生

作为多媒体方向的研究工程师,你可以: 1、负责口语语言理解、用户意图理解、对话模型、人机对话、深度学习、深度强化学习等算法研究和开发; 2、负责语音识别/合成方向的技术研发工作,包括但不限于语音前端处理、声学模型/语言模型的建立、语言解码、语音合成(TTS)等; 3、负责针对对话交互的领域知识图谱建设和智能问答; 4、负责下一代视频编解码标准研究,负责视频编解码算法实现及优化; 5、负责语音识别/合成方向、前沿视频编码技术和前沿视频处理技术等问题的探索与研究,结合未来实际应用场景,提供全面的技术解决方案。

logo of tencent
校招应届生

作为多媒体方向的研究工程师,你可以: 1、负责口语语言理解、用户意图理解、对话模型、人机对话、深度学习、深度强化学习等算法研究和开发; 2、负责语音识别/合成方向的技术研发工作,包括但不限于语音前端处理、声学模型/语言模型的建立、语言解码、语音合成(TTS)等; 3、负责针对对话交互的领域知识图谱建设和智能问答; 4、负责下一代视频编解码标准研究,负责视频编解码算法实现及优化; 5、负责语音识别/合成方向、前沿视频编码技术和前沿视频处理技术等问题的探索与研究,结合未来实际应用场景,提供全面的技术解决方案。

logo of tencent
校招青云计划-实习生

作为多媒体方向的研究工程师,你可以: 1、负责口语语言理解、用户意图理解、对话模型、人机对话、深度学习、深度强化学习等算法研究和开发; 2、负责语音识别/合成方向的技术研发工作,包括但不限于语音前端处理、声学模型/语言模型的建立、语言解码、语音合成(TTS)等; 3、负责针对对话交互的领域知识图谱建设和智能问答; 4、负责下一代视频编解码标准研究,负责视频编解码算法实现及优化; 5、负责语音识别/合成方向、前沿视频编码技术和前沿视频处理技术等问题的探索与研究,结合未来实际应用场景,提供全面的技术解决方案。

logo of tme
实习技术类

1.探索前沿机器学习技术在音频、图像、视频、多模态等多媒体技术方向的研究和应用; 2.基于多媒体技术提升用户体验及商业化实现; 3.推动多媒体新技术在QQ音乐/全民K歌等场景落地,或驱动新应用产生。

更新于 2025-02-25