腾讯语音合成专家
社招全职IEG技术地点:深圳状态:招聘
任职要求
1.在语音合成领域有不错的学术或工业产出;
2.编码能力良好,熟悉业界常用语音合成技术方案;
3.熟悉大模型分布式训练,调优,调试;
4.优秀的分析问题和解决问题…登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责面向游戏领域语音大模型的构建,包括预训练、指令微调、训练和推理加速、模型评测等; 2.探索大语音模型技术在游戏场景中的应用,为游戏创作、运营、交互体验等各环节提供更智能化的模型能力; 3.优化现有线上算法,包括对话TTS,千人千面语音,多语种TTS,音乐生成,歌声合成等方向研发工作,结合实际业务需求与数据,研发高效可靠的语音合成解决方案; 4.跟踪探索大语音模型的前沿技术与应用落地。
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
相关职位
社招技术类-算法
岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可
更新于 2025-06-10北京|杭州
社招3年以上
1. 负责淘宝直播数字人的语音合成系统开发,包括语音建模、情感表达、语速调节等功能的实现。 2. 优化TTS引擎,提高语音合成的自然度和流畅度,使数字人的声音更加贴近真人。 3. 研究并应用业界&学界前沿的语音合成大模型技术,提升直播互动体验。 4. 与产品、设计团队紧密合作,将TTS技术无缝集成到直播平台中,提升用户参与感。
更新于 2025-10-30北京|杭州
社招TEG技术
1.负责大模型语音模态的设计、开发和优化,包括但不限于语音/音频数据清洗、模型设计、训练策略等方面的研究与应用; 2.参与语音识别、语音合成、声音克隆等相关大模型语音模态能力的建设,提高跨模态整体效果。
更新于 2025-06-10北京