
阅文集团AIGC算法工程师(TTS)
社招全职3年以上技术地点:上海状态:招聘
任职要求
1. 硕士及以上学历,计算机、语音等相关专业,有3年及以上的语音算法领域的专业学习或相关工作经验; 2. 有落地过实际TTS项目,参与并主导过TTS项目,掌握语音合成的理论基础和常用算法; 3. 熟练使用Pytorch或Tensorflow等主流深度学习算法框架,具备良好的编程习惯; 4. 有GPT-SoVITS、fishspeech、chattts相关经验者优先; 5. 有良好的团队协作能力和工程能力,能够拥抱变化并快速学习,并具备一定的抗压能力。 6. 在相关领域期刊/会议发表过文章优先,例如ICASSP、AAAI、IJCAI(会议)等。
工作职责
1. 负责TTS语音大模型(GPT-SoVITS、fishspeech、chattts)的技术研发及落地; 2. 探索语音模型前沿进展,结合网文业务探索TTS落地场景; 3. 较强的工程实践能力,构建语音合成底层推理架构,包括推理加速、合成效率等; 4. TTS及声音复刻场景下情感、音色、韵律等维度的技术研究; 5. 构建TTS音色库及相关语音合成平台;
包括英文材料
学历+
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
编程规范+
[英文] Google Style Guides
https://google.github.io/styleguide/
Every major open-source project has its own style guide: a set of conventions (sometimes arbitrary) about how to write code for that project. It is much easier to understand a large codebase when all the code in it is in a consistent style.
GPT+
https://www.youtube.com/watch?v=kCc8FmEb1nY
We build a Generatively Pretrained Transformer (GPT), following the paper "Attention is All You Need" and OpenAI's GPT-2 / GPT-3.
相关职位
社招技术类
1、探索AIGC技术的相关技术,包括图片生成、视频生成、语音合成、数字人、智能对话等领域; 2、结合业务场景,设计并实现AIGC相关的算法和模型; 3、参与AIGC技术的性能优化和工程化工作; 4、持续学习和跟踪AIGC技术的最新进展,为团队提供技术支持和指导。
更新于 2025-10-08
社招D7965
1、负责AIGC算法在特效业务应用落地,结合公司内部快意/可图/可灵/TTS等大模型平台,按照业务需求在特效魔表/模板/虚拟人等领域进行AIGC应用落地; 2、负责短视频生产/直播/商业化/用增/电商等场景特效智能策略算法研发优化。提高用户对智能化魔表/模板/美化等特效使用基础体验,增强特效业务智能化; 3、负责特效大数据加工和分析,通过多模态内容理解、转化行为因果推断、QoS和QoE运筹优化等对特效全面理解,挖掘生产、消费信号,洞察业务痛点,指导及优化特效相关业务内容。
更新于 2025-06-20
社招网易数智
1、负责大语言模型微调, prompt优化,支持大语言模型相关项目 2、负责大语言模型在智能交互机器人,智能外呼,智能质检,AI Agent等业务场景上的应用研究 3、负责大语言模型的ToB场景下商业赋能,包括推理优化,私有化交付,同时结合传统小模型,协作形成技术到服务的最佳实践 4、负责大语言模型相关核心技术研发、前沿算法、开源模型与框架跟踪,根据产品需求完成技术转化,推动业务发展
更新于 2025-07-04