腾讯QQ-AI 大模型算法工程师(NLP方向)
任职要求
1.有大语言模型应用经验者优先,包括预训练,精调、强化学习、RAG等技术的落地; 2.熟悉自然语言处理相关算法,在ACL,EMNLP等学…
工作职责
1.负责大语言模型在产品应用上的算法优化及实现工作; 2.调研大模型的业界前沿算法,追踪最前沿的技术动态,并应用在相关的项目中; 3.参与项目讨论,基于技术判断和技术优化对产品应用提出改进建议。
1. 负责QQ音乐/长音频有声书中语音合成相关工作,应用场景包括QQ音乐中的播客解读、AI助手、AI伴听、AI互动聊天等场景,以及QQ音乐电台/懒人听书等长音频平台中AI有声书生产、声播AIGC制作工具等落地场景; 2. 负责最前沿的语音合成大模型的模型训练,算法优化,推理提速,业务上线等工作; 3. 负责音频理解大模型; 4. 负责全双工通信语音大模型的算法研究和实现。
1.参与元宝、QQ浏览器等场景AI搜索场景下文搜图、图搜图、文搜视频等多模搜索算法工作,通过技术优化,提升AI搜索场景下多模搜索效果; 2.工作内容包含但不限于:文图/图图/文视频召回、相关性、排序算法升级、系统优化等; 3.涉及技术包含但不限于:图片理解、图片质量、视频理解、多模态模型训练和调优、搜索召回、搜索相关性、搜索排序等; 4.持续探索前沿多模态搜索技术在AI搜索业务中的落地应用。
团队介绍: 高德语音技术部,是负责高德全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音内容生成、语音识别、跨模态模型、模型服务与推理。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。 团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHg) 具体职责包括但不限于: 1、语音识别、唤醒、语音与大模型融合等语音模块的研发,独立研究并完成业务落地; 2、结合高德出行导航、语音交互等业务场景,不断完善提升复杂业务场景下的语音理解能力。 3、与产品、工程架构团队一起完成技术方案的部署上线与性能优化,实现价值闭环。 4、持续追踪跟进业界前沿先进语音技术,结合业务需求开展技术创新与预研。