logo of didi

滴滴资深语音算法工程师(J250903029)

社招全职3-5年技术地点:北京状态:招聘

任职要求


1、电子、计算机或相关声学、信号处理专业毕业,具备一定语音信号处理基础
2、熟悉Pytorch框架,良好的编程能力,熟练使用python编程语言,具备Linux平台开发经验
3、3-5年语音识别、音频事件检测、声纹识…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责语音理解和语音生成算法在滴滴场景的落地使用
2、跟进最新技术,结合业务场景,提升语音识别、音频事件检测、声纹识别、语音合成等算法效果
3、探索语音大模型或多模态大模型在语音理解及语音生成场景的应用范式
包括英文材料
PyTorch+
Python+
Linux+
还有更多 •••
相关职位

logo of didi
社招3-5年技术

1、负责语音理解和语音生成算法在滴滴场景的落地使用 2、跟进最新技术,结合业务场景,提升语音识别、音频事件检测、声纹识别、语音合成等算法效果 3、探索语音大模型或多模态大模型在语音理解及语音生成场景的应用范式 4、算法优化,从模型架构、推理框架、量化压缩等角度提升模型推理速度、降低推理成本 Job Description 1. Responsible for the implementation of speech understanding and speech generation algorithms in Didi’s business scenarios. 2. Stay updated with the latest technologies and improve the performance of algorithms such as speech recognition, audio event detection, speaker recognition in real-world applications. 3. Explore the application paradigms of large language models or multimodal models in speech understanding and generation scenarios. 4. Optimize algorithms by enhancing inference speed and reducing costs through improvements in frameworks and quantization

更新于 2025-10-28北京
logo of tencent
社招2年以上GVoice游戏

1.负责腾讯游戏新一代匹配系统的算法设计和业务落地工作; 2.分析游戏数据,实现实时胜率预测、玩家状态判定、角色平衡性分析及⽤户体验分析算法; 3.参与腾讯游戏项目,推动匹配系统的创新。

更新于 2025-11-14上海
logo of ctrip
社招3年以上技术团队AI &

1) 负责文本和语音智能客服中相关NLP等算法的实现和深度应用; 技术点如:语义匹配、多轮对话、智能问答、信息抽取、语音算法、推荐算法等; 2) 负责客服系统的全面智能化改造,提升系统运行效率和稳定性; 3)参与AI新技术研究和应用方案落地,包括大模型,虚拟人等。

更新于 2025-05-28上海
logo of bytedance
社招3年以上A29402

1、深度参与大模型平台产品,协同产品和研发团队高质量交付产品; 2、通过测试技术,提升测试效率及测试覆盖度; 3、负责开发测试工具,推进系统的稳定性建设; 4、根据系统特性,探索测试手段,参与专项的质量建设。

更新于 2024-02-28上海