理想汽车基座模型-大模型算法实习生-语音合成方向-北京
任职要求
1. 机器学习、模式识别、信号处理或相关专业的本科或硕士; 2. 有语音、NLP相关背景经验,熟悉常用的机器学习和深度学习算法; 3. 熟练掌握C/C++、Python、Shell…
工作职责
1. 参与实现语音合成的训练调优等,包括正则化、多音字、韵律、口语化改写等算法研发和落地; 2. 探索大语言模型在语音合成中的应用,承接自由对话,口语化表达等场景任务,支持理想同学车机和手机功能创新。
团队介绍: 高德语音技术部,是负责高德全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音内容生成、语音识别、多模态模型、模型服务与推理。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。 团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHg) 具体职责: 1、参与语音识别、语音合成、Audio Codec、语音大模型等语音能力的设计和训练,解决高德业务场景实际问题。 2、提升鲁棒ASR、多语种(方言)ASR、LLM-ASR、大规模热词、全双工交互等语音理解能力。 3、提升Zero-Shot TTS、多语种TTS、情感TTS、声音复刻等语音生成能力。 4、持续追踪跟进业界前沿先进语音技术,结合业务需求开展技术创新与预研。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、支持抖音等国内产品内容算法在VLM相关的基础算法开发和基座模型建设,提升模型的评测分数和下游落地应用效果,支持从训练到在线推理的相关算法能力迭代; 2、从事VLM数据工程、模型结构、训练方法等方向的前沿技术探索和研发,发表学术论文和申请专利; 3、支持包括推荐算法、社区治理、安全审核、对话算法等其他算法团队对VLM基座以及基础多模态技术的需求。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、支持抖音等国内产品内容算法在VLM相关的基础算法开发和基座模型建设,提升模型的评测分数和下游落地应用效果,支持从训练到在线推理的相关算法能力迭代; 2、从事VLM数据工程、模型结构、训练方法等方向的前沿技术探索和研发,发表学术论文和申请专利; 3、支持包括推荐算法、社区治理、安全审核、对话算法等其他算法团队对VLM基座以及基础多模态技术的需求。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、支持抖音等国内产品内容算法在VLM相关的基础算法开发和基座模型建设,提升模型的评测分数和下游落地应用效果,支持从训练到在线推理的相关算法能力迭代; 2、从事VLM数据工程、模型结构、训练方法等方向的前沿技术探索和研发,发表学术论文和申请专利; 3、支持包括推荐算法、社区治理、安全审核、对话算法等其他算法团队对VLM基座以及基础多模态技术的需求。