百度音频算法工程师(J81041)
社招全职MEG地点:北京状态:招聘
任职要求
-在音频处理、计算机视觉(CV)、大模型等相关领域有深入研究,特别是在音频分析(如语音识别、音频分类、音频信号处理等)、无监督/半监督学习、Metric Learning等方面有实践经验 -熟练掌握至少一种编程语言(如C++、Python),具备扎实的编程能力,能够快速学习并应用业界领先的技术 -具备深度学习模型的训练与部署经验,能够将算法有效应用于风控业务,验证并提升算法效果 -拥有较强的分析与解决问题的能力,特别是在音频处理和内容安全领域,能够应对具有挑战性的技术问题 -有风控算法研发经验或音频/视频内容检测相关经验者优先
工作职责
-负责处理产品中音频、视频等内容的安全问题,包括但不限于色情、暴力等违规内容的识别与处理 -基于音频处理技术(如语音识别、声纹识别、音频分类等)和人工智能大模型,开发并落地内容安全检测模型,确保从海量音视频数据中高效识别风险内容 -研发和优化内容风控解决方案,分析违规数据的特点,并为平台提供全面的风控保障 -探索和应用前沿语音算法技术,方向涵盖但不限于语音识别、声纹识别、音频相似性匹配、多模态大模型等 -针对音频文件中的风险内容,深入研究并开发高效的自动化检测算法,提升风控系统的智能化与自动化水平
包括英文材料
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
语音识别+
https://www.youtube.com/watch?v=mYUyaKmvu6Y
Learn how to implement speech recognition in Python by building five projects.
https://www.youtube.com/watch?v=sR6_bZ6VkAg
How Rev.com harnesses human-in-the-loop and deep learning to build the world's best English speech recognition engine
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
相关职位
校招AI/算法类
作为音频团队的一份子,你将有机会和团队中业界顶尖的的技术专家和合作伙伴一起开发创新的音频算法,让更多的消费者喜欢我们的声音和产品! 具体工作方向包括: 1.发现音频领域创新场景运用和提供算法解决方案; 2.参与移动设备中音频链路的算法开发和落地,包括采集、处理、回放和渲染等环节; 3.负责音频一个或多个算法模块的技术演进和开发; 4.负责算法模块在产品中的落地交付,达到设计指标; 5.跟踪业界最新技术发展,评估并预研新技术方向和技术。
更新于 2025-07-14
社招研发类
1. 从事音频领域的算法研究及开发工作,包括语音增强(AEC、ANC、BSS等)、智能语音(唤醒、多命令词、声纹识别、场景检测、事件检测等)、影音音效(空间音频、smartPA)等。 2. 负责音频算法的预研,交付等工作
更新于 2025-07-28