logo of baidu

百度ai语音算法研发(实习)(J86336)

实习兼职ACG地点:上海状态:招聘

任职要求


-计算机科学、电子工程、信号处理或相关专业本科及以上学历,具有扎实的数学基础和编程能力;
-熟悉语音信号处理、语音识别等基本原理和算法;
-熟练掌握C/C++Python等编程语言,熟悉Linux操作系统和常用开发工具; 
-了解常用的语音算法库和工具,如Kaldi、wenet、SpeechBrain/TensorFlow/Pytorch等;
-有语音信号处理,模型设备端优化,嵌入式设备部署与调试等相关项目经验者优先
-具备良好的分析问题和解决问题的能力,对解决具有挑战性问题充满激情;

工作职责


-负责语音信号处理算法的研究、设计、开发和优化,包括但不限于特征提取、降噪、回声消除等;
-参与语音唤醒、识别算法的研发,提高唤醒准确率和识别速度; 
-参与模型的工程化落地,以及相关算子的优化开发
-与其他技术栈紧密合作,确保语音算法在公司产品中的有效应用;
包括英文材料
学历+
语音识别+
算法+
C+
C+++
Python+
Linux+
TensorFlow+
PyTorch+
相关职位

logo of antgroup
实习研究型实习生

研究领域: 多媒体 项目简介: 在AGI产品日益普及的当下,语音作为用户与智能系统之间的重要交互方式,正被广泛接受和应用。为了提供更为自然流畅的语音交流体验,我们需要聚焦以下关键问题: 1. 语言特性:包括韵律、情感等语音习惯的模拟,使得合成语音更接近于真实人类的表达,确保对话的流畅性和可控性。 2. 实时响应:力求在极短的响应时间内(毫秒级)生成语音,以满足用户对于实时互动的需求。 因此,本项目旨在研发高可信度的语音合成方案,并将其成功应用于支小宝等业务场景中。研究方向涵盖但不限于情感可控合成、副语言合成、韵律控制、流式生成等多个技术领域。

logo of bytedance
实习A258772

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责大规模机器学习系统架构的设计开发,解决系统高并发、高可靠性、高可扩展性等技术难关; 2、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、分布式模型训练、数据管理、高性能计算等; 3、负责机器学习系统前瞻技术的调研和引入,比如:最新硬件架构、异构计算系统、编译优化技术、强化学习RL/Agent环境交互技术等的引入落地; 4、与算法部门深度合作,进行算法与系统的联合优化。

更新于 2025-05-14
logo of bytedance
实习A68349

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责大规模机器学习系统架构的设计开发,解决系统高并发、高可靠性、高可扩展性等技术难关; 2、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、分布式模型训练、数据管理、高性能计算等; 3、负责机器学习系统前瞻技术的调研和引入,比如:最新硬件架构、异构计算系统、编译优化技术、强化学习RL/Agent环境交互技术等的引入落地; 4、与算法部门深度合作,进行算法与系统的联合优化。

更新于 2025-05-14
logo of bytedance
实习A251232

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责大规模机器学习系统架构的设计开发,解决系统高并发、高可靠性、高可扩展性等技术难关; 2、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、分布式模型训练、数据管理、高性能计算等; 3、负责机器学习系统前瞻技术的调研和引入,比如:最新硬件架构、异构计算系统、编译优化技术、强化学习RL/Agent环境交互技术等的引入落地; 4、与算法部门深度合作,进行算法与系统的联合优化。

更新于 2025-05-14