影石语音算法实习生
任职要求
1、计算机、自动化、应用数学、信号处理等相关专业硕士及以上学历; 2、具备扎实的数学和算法基础、信号处理基础等,在语音降噪、语音识别、语音唤醒、声纹识别等一个或多个方向上有丰富的理论基础和落地经验; 3、具备优秀的c…
工作职责
1、负责语音降噪、语音唤醒、语音识别等前沿语音算法的研发; 2、负责算法模型在业务场景数据集上的优化,导出部署在端侧或云端平台; 3、跟进行业最新算法动态,复现和优化前沿算法,保持算法在工业界和学术界的领先
-实验最新语音合成、理解方案,并对其中的模块进行解耦和分析。 -结合大模型范式,参与研发语音Encodec、Decoder、多模态对齐等模块,构建LLM based TTS和端到端Speech2Speech系统。 -参与到具体的语言合成业务落地工作 -参与语音大模型的评测及优化。
-实验最新语音合成、理解方案,并对其中的模块进行解耦和分析。 -结合大模型范式,参与研发语音Encodec、Decoder、多模态对齐等模块,构建LLM based TTS和端到端Speech2Speech系统。 -参与到具体的语言合成业务落地工作 -参与语音大模型的评测及优化。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、支持抖音等国内产品内容算法在VLM相关的基础算法开发和基座模型建设,提升模型的评测分数和下游落地应用效果,支持从训练到在线推理的相关算法能力迭代; 2、从事VLM数据工程、模型结构、训练方法等方向的前沿技术探索和研发,发表学术论文和申请专利; 3、支持包括推荐算法、社区治理、安全审核、对话算法等其他算法团队对VLM基座以及基础多模态技术的需求。