小红书多模态-语音实习生

实习兼职大模型2025-07-28地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

良好的 pytorch / python 技术栈，具备熟练的阅读代码和编写代码的能力。
在语音领域（包括但不限于 …

登录查看完整任职要求

微信扫码，1秒登录

工作职责

在算力驱动的 AGI 和人文精神的烟火气交汇之处，我们真诚邀请对大模型 Omni Model 有热情的同学加入，共同打造更具影响力的智能系统。你会成为团队的一员，并和其他同事协作，共同研发 SOTA 的 Omni Model。期待你以务实和客观的科学态度来推进技术的进展，不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态。
区别于传统 ASR / TTS 级联技术，我们希望打造端到端的 Omni Model 在实时交互中释放大模型的智力水平，彻底改变以 Chatbot 文字为主的人机交互界面
岗位说明：你会负责围绕大模型 Omni Model 构建语音模态的相关研究工作，包括但不限于如下事项
海量的语音数据处理和构建：定性分析、定量评估数据质量，并给出 scalable 的改进方案；探索跨模态（文字/视觉/语音）混合训练的最佳实践；
探索更加高效且合理的模型架构，让模型更加理解音频，同时让模型具备更好的语音合成能力
研究并探索基于 Omni Model 的 Post Train，包含但不限于 SFT 和 RL

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

PyTorch+

Python+

相关职位

语音算法实习生

实习实习生

1、参与多模态语音理解+生成（speech、audio、music）领域的科研，效果优秀后推动在视频、游戏业务场景下的算法研发、落地，包括但不限于数据处理、模型训练、效果调优； 2、紧跟前沿技术、参与关键技术创新、突破与积累，撰写论文。

更新于 2025-08-13上海

AIGC-语音算法实习生

实习

1. 负责语音合成、语音克隆、双工语音通话等语音生成相关技术的数据处理、模型效果验证，并协助业务落地； 2. 负责持续跟进业界前沿算法发展方向，支持公司在核心技术上的影响力发展。

更新于 2025-03-05北京

语音算法研究实习生

社招算法研究

1. 参与多模态语音交互场景下的语音理解、语音生成和语音交互大模型的算法研发、性能优化与落地实现； 2.参与数字人场景下的个性化实时情感对话语音合成、低资源音色克隆、语音识别、语音增强、语音检测、语种识别、声纹识别、说话人分割、变声、音乐生成等技术研发； 3.参与语音相关算法引擎的流式改造、推理优化、大并发低延迟云服务、私有化服务定制开发； 4.跟进学术界、行业最新的研究趋势，产出新的科研成果，并落地于实际产品。

更新于 2025-11-18北京|深圳

语音算法研究实习生

实习算法研究

更新于 2025-11-18北京|深圳