logo of transsion

传音资深TTS算法工程师(J17389)

社招全职2年以上地点:上海状态:招聘

任职要求


数学、计算机、自动化、信号处理等相关专业硕士及以上学历,两年以上语音合成的算法研究、项目开发经验;
深刻理解TTS原理,使用过开源架构声学模型Tacotron和声码器WaveGlow、WaveRNN、HifiGAN等;
TTS前端Cleanser、TN、G2P有一定经验;
了解语音发生机理,对语音信号处理有一定基础,如基频检测跟踪、变速变调等;
熟练掌握Python,至少熟练使用一种深度学习训练框架,如TensorflowPytorch等;
对Singing Voice Sythesis、Voice Conversion、Expressive TTS经验者优先;
对工程落地优化上有一定经验的优先考虑。

工作职责


负责语音合成(TTS)核心算法的研发、性能优化与落地实现,推动TTS技术在实际产品中的应用;
结合业务规划,跟进学术界、行业最新的研究趋势,将预研成果落地于实际产品,并主导相关技术方案的制定和实施;
负责TTS相关技术难题的攻关,提升合成语音的自然度、表现力和鲁棒性;
指导和带领初级工程师,提升团队整体技术水平。
包括英文材料
学历+
算法+
Python+
深度学习+
TensorFlow+
PyTorch+
相关职位

logo of transsion
社招4年以上

1. 负责AI 加速硬件的性能评估分析,在单机单卡/大规模集群等场景进行全方位的软硬件系统性能评估,分析调优和业务交付落地; 2. 配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统; 3. 参与过 ASR, TTS 语音工程化落地项目 或参与过 CV 项目. 4. 大模型技术前沿追踪以及框架应用。 5. 深入研究和优化大模型的训练方法,提高模型的效率和效果经验者优先 6. 优化大模型推理性能,提升吞吐并控制成本经验者优先 7. 优化大模型推理框架,提升框架扩展性,易用性和可调试性经验者优先。

更新于 2025-04-16
logo of xpeng
社招3年以上

1. 参与语音交互算法工程化工作(包括但不限于asr,nlp,tts,多模大模型)关联模块及端到端的架构设计和功能开发; 2. 多平台(如GPU,高通8155/8295芯片平台)的模型推理优化及加速;

更新于 2024-11-28
logo of transsion
社招5年以上

1. 负责AI语言模型运营团队的日常运营管理,联合算法承担AI算法模型(TTS、ASR、NLU)在各产品线运营的效果提升,负责多门语言的语言学研发并落地AI技术,重点为语音助手业务的功能扩展和体验优化做好服务。 2. 目标规划:通过技术洞察,参与对各产品线的算法各模块和整体模块的效果优化步骤进行规划,并预估资源耗费。 3. 语言研发:针对算法效果提升,多语言需求等,对语言规则进行整理并创新理论,并应用到实际的AI语言技术中。 4. 团队管理:对模型运营团队进行架构设计,人员管理,SOP梳理。 5. 跨部门沟通:与数据生产团队、算法部门、产品团队等沟通,团结一致,完成业务目标。

更新于 2025-02-12
logo of netease
社招3-5年网易游戏(互娱)

1、聚焦生成式 AI 技术在游戏场景的深度应用,负责创意内容产品的全流程设计与落地。牵头构建 AI 内容生成与互动社区生态,推动 AI 创作能力体系建设,实现技术能力向用户价值与业务增长的转化; 2、深度结合多模态 AIGC 技术,统筹文本、图像、视频、TTS 语音、播客等内容形态的生成能力开发,探索其与游戏玩法、社区互动等场景的创新融合模式,驱动高质量内容生产,并持续优化用户创作体验与内容消费体验; 3、建立覆盖 AI 内容生产、分发、消费全链路的产品追踪与评估机制,通过数据指标体系量化内容质量、用户参与度及商业价值。打造 “生产 - 消费 - 反馈 - 迭代” 的业务闭环,实现产品体验与运营效率的持续提升。​

更新于 2025-10-09