腾讯腾讯云--- 音频语音识别/理解算法高级工程师

社招全职CSIG技术2025-06-19地点：深圳状态：招聘

扫码手机上打开

任职要求

1.硕士及以上学历，声学、信号处理等其他相关专业；
2.对于音频处理领域与背景有深刻理解，具备一定声学信号处理数学建模能力，对于大模型llm量化与训练经验、特定人声增强、端到端多语种语音识别、轻量级端侧高效语音识别、个性化声纹情绪等语音合成有实际项目，且参加过相关比赛的同学优先；
3.在W…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.负责语音识别ASR应用涉及的效果调优与实现，比如多语种语音识别与翻译（中/英/法/日/韩/东南亚/中东等）、端侧超级轻量级高效ASR的落地实现、解决目标说话人增强的ASR相关技术的落地、声学/语意vad等；
2.负责语音识别asr-llm大模型与前沿技术调研与落地，比如更合理的语音与文本对齐、适用于多语种的模型方案、更高效的弱监督数据筛选流程等；
3.负责跟踪并复现业界最前沿的音频处理方案，并能融合优化当前效果。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

大模型+

语音识别+

Python+

还有更多 •••

登录查看完整学习资料

相关职位

优酷-UE5高级游戏客户端开发工程师-北京

社招3年以上

1、负责设计和实现游戏客户端的核心功能、系统和模块，包括用户界面、渲染、输入、音频、动画、物理等 2、开发和优化游戏客户端的性能、帧率和内存占用，确保游戏的流畅性和响应性 3、协助美术、策划建立高效的游戏内容制作流程，理解和实现游戏的需求和功能 4、协助美术、策划开发相关工具链，优化程序设计和工程结构 5、熟悉游戏开发工具和技术，如游戏引擎、集成开发环境、版本控制系统等

更新于 2025-04-02北京

多模态算法工程师-语音方向

社招大模型

在算力驱动的 AGI 和人文精神的烟火气交汇之处，我们真诚邀请对大模型 Omni Model 有热情的同学加入，共同打造更具影响力的智能系统。你会成为团队的一员，并和其他同事协作，共同研发 SOTA 的 Omni Model。期待你以务实和客观的科学态度来推进技术的进展，不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态。区别于传统 ASR / TTS 级联技术，我们希望打造端到端的 Omni Model 在实时交互中释放大模型的智力水平，彻底改变以 Chatbot 文字为主的人机交互界面岗位说明：你会负责围绕大模型 Omni Model 构建语音模态的相关研究工作，包括但不限于如下事项海量的语音数据处理和构建：定性分析、定量评估数据质量，并给出 scalable 的改进方案；探索跨模态（文字/视觉/语音）混合训练的最佳实践；探索更加高效且合理的模型架构，让模型更加理解音频，同时让模型具备更好的语音合成能力研究并探索基于 Omni Model 的 Post Train，包含但不限于 SFT 和 RL

北京|上海

算法工程师/研究员(J65868)

社招0-3年XYZ

各类大模型算法岗位：包括不限于 ✓大模型应用（Rag、Agent的研究等） ✓大模型技术研究 (指令微调、强化学习、推理等) ✓多模态理解与生成研究（文本、图像、视频、音频等）

更新于 2025-02-18北京

语音算法研究员（深圳/北京）

社招4年以上TEG技术

1.负责AI Lab语音技术团队语音技术，包括TTS、语音压缩编码、语音前端处理等，尤其是基于AIGC算法的基础研究和应用落地。； 2.侧重于研发语音合成、语音转换、few-shot / zero-shot TTS、音频和音乐生成等先进算法尤其是生成类算法，并且可以融合语音识别、音频分析、语音增强、语音分离等更广泛的语音/音频任务。将有关算法成果应用于语音 / 音乐 / 音效/音频生成、语音翻译（S2TT、S2ST）、虚拟人等众多场景中。； 3.通过跟踪和创新，确保算法方面的行业领先，通过打造语音技术PAAS平台服务于腾讯内部各个业务场景包括游戏、社交、内容服务、广告、金融、车载助手、企业服务（如腾讯会议、企业微信、企点客服、商通、数智人）等等，帮助业务产生实际价值和打造业界领先的语音应用产品。； 4.持续关注学术界和行业的最新研究动态，参与国际会议、研讨会，与全球顶级团队进行交流合作。。

更新于 2025-04-17深圳