高德地图语音合成算法工程师-APP平台业务
任职要求
1、本科或研究生在读,有语音、自然语言处理、机器学习、多模态等相关背景; 2、掌握TensorFlow,PyTorch等社区开源工具中的一种及以上; 3、熟练掌握C/C++,Python,Shell编程语言,对数据结构和算法设计有较好的理解; 4、在相关国际会议或主流期刊(ICASSP,Interspeech,ICML,ICML,TASLP等)上发表论文者优先; 5、编程能力强,在ACM/ICPC、NOI/IOI、TopCoder、Kaggle等比赛获奖者优先; 6、良好的沟通能力和主动性。
工作职责
团队介绍: 高德语音技术团队,由高德资深算法专家,原微软小冰核心对话技术负责人组建,主要负责前沿语音技术在高德丰富场景中的落地应用。团队当前聚焦在语音合成、唤醒、语音AIGC等方向,探索前沿语音大模型技术对高德丰富产品形态的赋能。 具体职责包括但不限于: 1、对语音合成、自然语言处理、音视频多模态融合和大模型等方向感兴趣,独立研究并完成指定课题; 2、通过机器学习和人工智能技术来提升甚至重新定义音频内容创作工作,产出下一代超自然语音合成技术并应用于高德出行业务场景。
岗位职责包括但不限于: 1、参与开发和优化大规模深度学习模型,特别是在Agent系统、算法推理加速以及语音处理领域的应用; 2、研究并实现前沿的算法推理加速技术,包括但不限于模型压缩、量化、剪枝等方法,以提高模型效率和性能; 3、设计和开发智能Agent系统,通过强化学习、模仿学习等技术提升Agent在复杂环境下的决策能力; 4、专注于语音识别、语音合成等语音技术的研究与开发,提升语音业务的质量和用户体验; 5、与跨职能团队合作,将研究成果转化为产品解决方案,解决实际业务问题; 6、撰写技术文档,分享研究进展和技术心得。
字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、熟悉语音合成前端文本分析处理相关技术; 2、熟悉常见的声学模型和声码器,具有相关的开发和研究经验; 3、熟悉声音转换相关算法和技术; 4、熟悉通用合成引擎搭建及优化,具备云上和端上引擎优化经验。
字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、熟悉语音合成前端文本分析处理相关技术; 2、熟悉常见的声学模型和声码器,具有相关的开发和研究经验; 3、熟悉声音转换相关算法和技术; 4、熟悉通用合成引擎搭建及优化,具备云上和端上引擎优化经验。