logo of sensetime

商汤语音交互开发工程师

社招全职3年以上技术开发类地点:上海状态:招聘

任职要求


岗位要求:
1.计算机、电子、自动化、通信等相关专业,本科及以上学历,3 年以上语音/音频相关开发经验。
2.熟悉 对话管理、语音服务框架设计,具备实际项目经验。
3.精通 音频采集与播放链路,熟悉 ALSA、AudioFlinger、AudioTrack、OpenSL ES 等音频框架。
4.熟悉 端侧 ASR/TTS 引擎部署(如 Kaldi、WeNet…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


工作职责:
1.负责 端侧语音交互系统开发,包括语音唤醒、语音识别、语音合成及对话管理模块。
2-参与 座舱系统、小型机器人、IoT 交互设备 的语音服务及场景化交互方案研发。
3-设计并实现 语音服务框架,支持多场景、多模态的交互能力。
4-设计 对话管理引擎(Dialog Manager) 或 多轮对话。
5-与产品、算法、UI/UX 团队紧密协作,实现高效、自然的人机语音交互体验。
6-跟踪行业发展,探索 端云协同语音架构 及 轻量化语音模型 在不同硬件平台的落地应用。
团队沟通能力,能够推动语音交互功能从方案到产品落地。
包括英文材料
学历+
ElasticSearch+
语音识别+
语音合成+
系统设计+
大模型+
还有更多 •••
相关职位

logo of bytedance
社招A21081

1、负责跨平台(iOS/Android/Linux)、跨端(服务端+客户端)语音交互SDK设计、开发与优化; 2、和各产品线合作, 接入成熟的语音交互相关处理算法,提升语音交互在产品中的表现效果; 3、参与开发支持语音交互相关业务落地和技术研发; 4、持续学习新编程技术、工业界学术界语音系统进展,精炼业务逻辑。

更新于 2024-08-21北京
logo of bytedance
社招A238469

1、负责跨平台(iOS/Android/Linux)、跨端(服务端+客户端)语音交互SDK设计、开发与优化; 2、和各产品线合作,接入成熟的语音交互相关处理算法,提升语音交互在产品中的表现效果; 3、参与开发支持语音交互相关业务落地和技术研发; 4、持续学习新编程技术、工业界学术界语音系统进展,精炼业务逻辑。

更新于 2025-04-09上海
logo of sensetime
社招3年以上后端开发

1. 负责云端智能语音交互的模块设计和开发; 2. 具备语音行业的软件架构设计能力,能够进行接口的定义和开发; 3. 负责语音算法工程化,语音唤醒,识别,语义理解等集成开发工作; 4. 负责语音对话性能问题分析和优化; 5. 具备端到端语音模型开发经验的优先;

更新于 2025-06-03上海
logo of meituan
社招5年以上核心本地商业-业

该岗位未来1-2年,主要负责大模型电话智能服务方向的探索和研发。 系统能力方向:大模型电话应用方向会在厘清、解决、对话策略、规则等方向不断探索和优化,打造行业一流的大模型电话服务系统。参与负责系统能力的迭代把控。负责需求的落地、架构规划,主导技术方案的设计。负责参与大模型应用各阶段能力的建设。 数据能力方向:系统能力所产生的服务数据,对提升服务体验和解决能力有着至关重要的作用,是改善服务能力的重要观测工具。负责参与数据运营能力的建设,建设相应的数据大盘及监控工具。 团队合作方向:负责与跨团队智能工具能力建设,如风控、路由、用户分层等。 在上述方向上同时负责日常服务问题的处理,在部分核心能力建设上作为主R带领其他同学高质量的完成需求交付,达成业务结果。

更新于 2025-06-05北京|上海|成都