字节跳动语音交互算法工程师-Data语音
社招全职A29448地点:北京状态:招聘
任职要求
1、计算机、信息相关专业,在智能硬件等场景有音频信号处理落地和优化经验; 2、对基于LLM的语音识别和音频理解系统有实践经验,对前沿的识别系统有优化经验; 3、…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、支持语音交互技术在字节跳动公司内外丰富的业务场景落地,解决落地过程中的前沿问题,持续优化在智能硬件中的音频理解及处理,以及语音助手核心技术效果; 2、专注端侧智能交互的前沿技术和算法效果,追求和探索业界最前沿算法; 3、负责字节跳动旗下音频内容创作和消费业务场景的智能移频理解和处理算法研发和业务支持; 4、跟踪智能音频领域的最新技术进展并升级团队自研的各算法系统,包括回声消除、AI降噪、多通道音频处理、音频事件理解与检测; 5、跟踪研发业界先进的音频进展,统计模型/机器学习/深度学习技术在语音/音频领域研发并落地产品。
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
语音识别+
https://www.youtube.com/watch?v=mYUyaKmvu6Y
Learn how to implement speech recognition in Python by building five projects.
https://www.youtube.com/watch?v=sR6_bZ6VkAg
How Rev.com harnesses human-in-the-loop and deep learning to build the world's best English speech recognition engine
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
还有更多 •••
相关职位
社招A217930
1、负责为抖音客服业务VOIP和热线等语音交互场景提供专业的音频技术支持与研发,运用端到端的语音大模型实现更高效、智能的客服音频交互体验; 2、负责端到端语音大模型在客服应用中的落地与优化,搭建智能音频理解和处理在客服领域的系统级解决方案; 3、跟进客服产品业务的语音/音频需求,持续改进产品的音频质量体验;结合实际业务场景,对模型进行针对性训练和调优,确保语音识别、合成等功能能精准适配客服对话需求,提升对话理解和回复的准确性; 4、跟踪研发业界先进的音频进展,探索语音/音频领域最新技术的研发并落地产品。
更新于 2025-03-11深圳
社招A98852
1、支持端到端语音多模态大模型技术在字节跳动公司内外丰富的业务场景落地,解决落地过程中的前沿问题,持续优化落地效果; 2、探索前沿的多模态技术,专注语音多模态大模型的前沿技术和算法效果,追求和探索业界最前沿算法,包括但不限于语言、音乐、语音、音频的生成与理解等; 3、深入调研和关注音频/NLP/多模态等方向的前沿技术。
更新于 2025-02-17北京
社招A26261
1、支持语音交互技术在字节跳动公司内外丰富的业务场景落地,解决落地过程中的前沿问题,持续优化在智能硬件中的音频理解及处理,以及语音助手核心技术效果; 2、专注端侧智能交互的前沿技术和算法效果,追求和探索业界最前沿算法; 3、负责字节跳动旗下音频内容创作和消费业务场景的智能移频理解和处理算法研发和业务支持; 4、跟踪智能音频领域的最新技术进展并升级团队自研的各算法系统,包括回声消除、AI降噪、多通道音频处理、音频事件理解与检测; 5、跟踪研发业界先进的音频进展,统计模型/机器学习/深度学习技术在语音/音频领域研发并落地产品。
更新于 2024-07-26上海