小红书大模型语音识别算法工程师
任职要求
1.AI、EE、CS相关专业; 2.熟悉语音识别算法,对语音识别系统落地和业务效果优化有实际经验; 3.对工业级大规模数据有实际处理经验,有使用海量数据优化实际业务模型的动手经验; 4.良好的团队沟通能力,积极思考,主动解决问题者优先; 5.在相关国际会议或期刊(ICASSP、INTERSPEECH、 ASRU、ISMIR、 TASLP、 Speech Communication)发表过论文者优先
工作职责
1.支持语音识别及音频理解在小红书丰富业务场景的落地,持续优化大模型语音识别效果 2.跟进最领先的音频理解技术体系,包括但不限于提出新的音频理解技术框架、改进现有的算法、持续提升相关技术及业务指标,鼓励撰写论文及申请专利。
1.优化大规模商用语音识别系统,提高系统的鲁棒性和性能; 2.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进; 3.追踪业界前沿的语音技术,探索语音大模型在业务场景下的应用。
1.优化大规模商用语音识别系统,提高系统的鲁棒性和性能; 2.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进; 3.追踪业界前沿的语音技术,探索语音大模型在业务场景下的应用。
1、负责核心算法研发: 1)负责语音识别(ASR)算法的设计与优化,构建高精度、低延时的语音处理系统; 2)主导语种识别(LID)、说话人分离(SSD)等语音相关技术的研发与落地; 3)深入探索Whisper/FunASR等开源语音项目,结合业务需求进行技术创新与改进; 2、负责技术应用与优化: 1)将语音算法应用于会议转录、实时字幕、语音消息等ToB办公场景; 2)优化语音模型在云端的推理性能,提升资源利用效率; 3)建设语音领域的高质量数据集及评测体系; 3、工程能力建设: 1)深入使用Python进行算法开发,熟练应用PyTorch/TensorFlow搭建训练Pipeline; 2)构建高性能推理框架,探索TensorRT/Triton/OnnxRuntime等加速工具的应用; 4、跨团队协作: 1)与产品团队合作挖掘用户需求,推动语音技术在产品中的创新应用; 2)与工程团队协作完成模型部署,解决端到端落地中的技术挑战; 5、技术前瞻性研究: 1)持续跟踪ICASSP/INTERSPEECH等顶会最新进展; 2)探索语音与大模型结合的创新方向。
1、负责核心算法研发: 1)负责语音识别(ASR)算法的设计与优化,构建高精度、低延时的语音处理系统; 2)主导语种识别(LID)、说话人分离(SSD)等语音相关技术的研发与落地; 3)深入探索Whisper/FunASR等开源语音项目,结合业务需求进行技术创新与改进; 2、负责技术应用与优化: 1)将语音算法应用于会议转录、实时字幕、语音消息等ToB办公场景; 2)优化语音模型在云端的推理性能,提升资源利用效率; 3)建设语音领域的高质量数据集及评测体系; 3、工程能力建设: 1)深入使用Python进行算法开发,熟练应用PyTorch/TensorFlow搭建训练Pipeline; 2)构建高性能推理框架,探索TensorRT/Triton/OnnxRuntime等加速工具的应用; 4、跨团队协作: 1)与产品团队合作挖掘用户需求,推动语音技术在产品中的创新应用; 2)与工程团队协作完成模型部署,解决端到端落地中的技术挑战; 5、技术前瞻性研究: 1)持续跟踪ICASSP/INTERSPEECH等顶会最新进展; 2)探索语音与大模型结合的创新方向。