百度音频算法工程师(J81041)
社招全职MEG地点:北京状态:招聘
任职要求
-在音频处理、计算机视觉(CV)、大模型等相关领域有深入研究,特别是在音频分析(如语音识别、音频分类、音频信号处理等)、无监督/半监督学习、Metric Learning等方面有实践经验 -熟练掌握至少一种编程语言(如C++、Python),具备扎实的编程能力,能够…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
-负责处理产品中音频、视频等内容的安全问题,包括但不限于色情、暴力等违规内容的识别与处理 -基于音频处理技术(如语音识别、声纹识别、音频分类等)和人工智能大模型,开发并落地内容安全检测模型,确保从海量音视频数据中高效识别风险内容 -研发和优化内容风控解决方案,分析违规数据的特点,并为平台提供全面的风控保障 -探索和应用前沿语音算法技术,方向涵盖但不限于语音识别、声纹识别、音频相似性匹配、多模态大模型等 -针对音频文件中的风险内容,深入研究并开发高效的自动化检测算法,提升风控系统的智能化与自动化水平
包括英文材料
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
语音识别+
https://www.youtube.com/watch?v=mYUyaKmvu6Y
Learn how to implement speech recognition in Python by building five projects.
https://www.youtube.com/watch?v=sR6_bZ6VkAg
How Rev.com harnesses human-in-the-loop and deep learning to build the world's best English speech recognition engine
还有更多 •••
相关职位
社招3年以上CSIG技术
1.负责实时互动 AI 对话技术的研究与开发,推动算法在语音识别、增强、理解、合成等方向的落地与优化; 2.跟踪学术界及行业最新研究动态,并结合业务需求优化现有算法,提升系统性能和用户体验。
更新于 2025-04-17北京
社招AIGC算法
1.在业务场景下围绕语音及音乐,支撑小红书平台多项业务板块,将AI语音交互/音乐理解及生成等技术赋能产品线 2.跟进最领先的语音交互技术/音乐理解及生成技术,包括但不限于提出新的技术框架、改进现有的算法、持续提升相关技术及业务指标,鼓励撰写论文及申请专利。
更新于 2026-04-07北京|上海
社招A217930
1、负责为抖音客服业务VOIP和热线等语音交互场景提供专业的音频技术支持与研发,运用端到端的语音大模型实现更高效、智能的客服音频交互体验; 2、负责端到端语音大模型在客服应用中的落地与优化,搭建智能音频理解和处理在客服领域的系统级解决方案; 3、跟进客服产品业务的语音/音频需求,持续改进产品的音频质量体验;结合实际业务场景,对模型进行针对性训练和调优,确保语音识别、合成等功能能精准适配客服对话需求,提升对话理解和回复的准确性; 4、跟踪研发业界先进的音频进展,探索语音/音频领域最新技术的研发并落地产品。
更新于 2025-03-11深圳