logo of bilibili

哔哩哔哩语音算法工程师(ASR方向)【2027届】

实习兼职技术类地点:上海状态:招聘

任职要求


1、计算机科学、人工智能等相关领域研究经验;
2、有语音大模型相关前沿技术研究及发表论文经验,理解多模态/生成式模型的原理,熟悉大模型底层技术,敢于挑战技术边界;
…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、语音对话,情感陪伴对话系统,全双工对话系统等的探索,系统搭建,模型训练;
2、前沿语音技术跟进、行业动态和主流模型框架的调研,学术研究及相关论文发表;
3、数据生成,对话数据开源调研,数据链路清洗,数据管理
4、语音模型的后训练优化,sft,rl等后训练方法的具体实践和优化。情感陪伴的效果调优
包括英文材料
大模型+
还有更多 •••
相关职位

logo of transsion
社招7年以上

1、负责语音相关技术研究(语音增强、唤醒、声纹、VAD、语音识别等),包括声学模型、语言模型的数据准备、模型训练和解码器优化; 2、主导工程开发,包括模型服务化,海量语音数据处理,模型网络结构优化以及工程优化; 3、跟进业界最新技术,并运用于实际产品。

更新于 2025-02-12上海
logo of bytedance
社招3年以上A250240

1、负责核心算法研发: 1)负责语音识别(ASR)算法的设计与优化,构建高精度、低延时的语音处理系统; 2)主导语种识别(LID)、说话人分离(SSD)等语音相关技术的研发与落地; 3)深入探索Whisper/FunASR等开源语音项目,结合业务需求进行技术创新与改进; 2、负责技术应用与优化: 1)将语音算法应用于会议转录、实时字幕、语音消息等ToB办公场景; 2)优化语音模型在云端的推理性能,提升资源利用效率; 3)建设语音领域的高质量数据集及评测体系; 3、工程能力建设: 1)深入使用Python进行算法开发,熟练应用PyTorch/TensorFlow搭建训练Pipeline; 2)构建高性能推理框架,探索TensorRT/Triton/OnnxRuntime等加速工具的应用; 4、跨团队协作: 1)与产品团队合作挖掘用户需求,推动语音技术在产品中的创新应用; 2)与工程团队协作完成模型部署,解决端到端落地中的技术挑战; 5、技术前瞻性研究: 1)持续跟踪ICASSP/INTERSPEECH等顶会最新进展; 2)探索语音与大模型结合的创新方向。

更新于 2025-05-01北京
logo of bytedance
社招3年以上A18766

1、负责核心算法研发: 1)负责语音识别(ASR)算法的设计与优化,构建高精度、低延时的语音处理系统; 2)主导语种识别(LID)、说话人分离(SSD)等语音相关技术的研发与落地; 3)深入探索Whisper/FunASR等开源语音项目,结合业务需求进行技术创新与改进; 2、负责技术应用与优化: 1)将语音算法应用于会议转录、实时字幕、语音消息等ToB办公场景; 2)优化语音模型在云端的推理性能,提升资源利用效率; 3)建设语音领域的高质量数据集及评测体系; 3、工程能力建设: 1)深入使用Python进行算法开发,熟练应用PyTorch/TensorFlow搭建训练Pipeline; 2)构建高性能推理框架,探索TensorRT/Triton/OnnxRuntime等加速工具的应用; 4、跨团队协作: 1)与产品团队合作挖掘用户需求,推动语音技术在产品中的创新应用; 2)与工程团队协作完成模型部署,解决端到端落地中的技术挑战; 5、技术前瞻性研究: 1)持续跟踪ICASSP/INTERSPEECH等顶会最新进展; 2)探索语音与大模型结合的创新方向。

更新于 2025-02-20上海
logo of transsion
社招3年以上

1.负责语音相关技术研究(语音增强、唤醒、声纹、VAD、语音识别等),包括声学模型、语言模型的数据准备、模型训练和解码器优化; 2.主导工程开发,包括模型服务化,海量语音数据处理,模型网络结构优化以及工程优化; 3.跟进业界最新技术,并运用于实际产品。

更新于 2025-01-17上海