荣耀音频算法工程师
社招全职研发类地点:北京 | 西安状态:招聘
任职要求
1. 声学、计算机、人工智能、信号处理、数学等专业;
2.具备扎实的数学基础,熟悉信号处理相关专业知识;
3. 熟悉常见的深度学习模型,包括但不限…登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 从事音频领域的算法研究及开发工作,包括语音增强(AEC、ANC、BSS等)、智能语音(唤醒、多命令词、声纹识别、场景检测、事件检测等)、影音音效(空间音频、smartPA)等; 2. 负责音频算法的预研,交付等工作。
包括英文材料
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
CNN+
https://learnopencv.com/understanding-convolutional-neural-networks-cnn/
Convolutional Neural Network (CNN) forms the basis of computer vision and image processing.
[英文] CNN Explainer
https://poloclub.github.io/cnn-explainer/
Learn Convolutional Neural Network (CNN) in your browser!
https://www.deeplearningbook.org/contents/convnets.html
Convolutional networks(LeCun, 1989), also known as convolutional neuralnetworks, or CNNs, are a specialized kind of neural network for processing data.
https://www.youtube.com/watch?v=2xqkSUhmmXU
MIT Introduction to Deep Learning 6.S191: Lecture 3 Convolutional Neural Networks for Computer Vision
RNN+
https://d2l.ai/chapter_recurrent-neural-networks/rnn.html
A neural network that uses recurrent computation for hidden states is called a recurrent neural network (RNN).
https://www.deeplearningbook.org/contents/rnn.html
Recurrent neural networks, or RNNs (Rumelhart et al., 1986a), are a family of neural networks for processing sequential data.
https://www.ibm.com/think/topics/recurrent-neural-networks
A recurrent neural network or RNN is a deep neural network trained on sequential or time series data to create a machine learning (ML) model that can make sequential predictions or conclusions based on sequential inputs.
还有更多 •••
相关职位
社招3年以上CSIG技术
1.负责实时互动 AI 对话技术的研究与开发,推动算法在语音识别、增强、理解、合成等方向的落地与优化; 2.跟踪学术界及行业最新研究动态,并结合业务需求优化现有算法,提升系统性能和用户体验。
更新于 2025-04-17北京
社招MEG
-负责处理产品中音频、视频等内容的安全问题,包括但不限于色情、暴力等违规内容的识别与处理 -基于音频处理技术(如语音识别、声纹识别、音频分类等)和人工智能大模型,开发并落地内容安全检测模型,确保从海量音视频数据中高效识别风险内容 -研发和优化内容风控解决方案,分析违规数据的特点,并为平台提供全面的风控保障 -探索和应用前沿语音算法技术,方向涵盖但不限于语音识别、声纹识别、音频相似性匹配、多模态大模型等 -针对音频文件中的风险内容,深入研究并开发高效的自动化检测算法,提升风控系统的智能化与自动化水平
更新于 2024-11-14北京
社招AIGC算法
1.在业务场景下围绕语音及音乐,支撑小红书平台多项业务板块,将AI语音交互/音乐理解及生成等技术赋能产品线 2.跟进最领先的语音交互技术/音乐理解及生成技术,包括但不限于提出新的技术框架、改进现有的算法、持续提升相关技术及业务指标,鼓励撰写论文及申请专利。
更新于 2026-04-07北京|上海