logo of xpeng

小鹏汽车机器人语音高级工程师/专家

社招全职地点:深圳状态:招聘

任职要求


1、电子、声学、信号处理、计算机科学或相关专业硕士及以上学历;
2、深入理解数字信号处理(DSP),精通去噪、回声消除、波束形成、声源定位等算法;
3、丰富的语音唤醒、声源定位、多通道语音增强开发经验;
4、熟练掌握 PythonC/C++,有嵌入式平台(如 ARM、DSP)音频算法部署经验;
5、具备深度学习框架(TensorFlowPyTorch)下的声学模型训练与调优能力;
6、优秀的跨部门沟通和项目管理能力,能在多团队协作中推动落地;
7、英语读写流利,能独立阅读国际前沿论文并撰写技术文档。

加分项
1、有主流 ASR 引擎(Kaldi、DeepSpeech、Tencent ASR 等)二次开发经验;
2、参与过机器人或智能硬件语音交互方案的端到端研发与落地;
3、熟悉声学测量仪器及实验室测试流程

工作职责


1、评审机器人麦克风阵列及声学硬件方案,提供软件接口与优化建议;
2、参与语音前端模块优化,例如多通道噪声抑制、回声消除和自动增益等算法的优化和设计;
3、参与开发并优化端侧语音唤醒与声源定位模块;
4、调优 ASR 声学模型与解码器参数,提升识别准确率与鲁棒性;
5、与硬件、嵌入式、测试及产品团队协作,推动语音软件方案落地。
包括英文材料
学历+
算法+
Python+
C+
C+++
深度学习+
TensorFlow+
PyTorch+
测试流程+
相关职位

logo of aliyun
社招技术类-算法

岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可

更新于 2025-06-10
logo of aliyun
社招5年以上云智能集团

1. 负责电话场景(呼入、外呼)语音机器人的工程研发,高效承接产品需求、输出标准技术方案并推进技术方案落地,确保系统的稳定性和可扩展性; 2. 与产品、算法、运营、测试等合作团队积极协同,提升产品的用户提升及技术竞争力,通过技术驱动业务发展; 3. 技术支持,对客户提出的问题可以快速分析原因并给出合理的解决方案; 4. 通过内外部渠道,了解并洞悉客户需求,并凝练形成对应的技术洞察; 5. 通过行业会议、技术媒体、学术研究、友商交流等方式,收集领域内的最新技术信息,包括但不限于技术原理、技术优劣势、应用场景等。

更新于 2025-08-07
logo of 58
社招技术类

负责自研语音识别引擎中的语音识别算法研发。

更新于 2022-02-10
logo of tcl
社招4年以上研发技术类

负责AI家庭陪伴机器人的多模态交互系统设计与开发,实现自然、拟人化的人机交互体验 **主要职责:** - 设计并优化多模态交互系统架构,整合语音、视觉、触觉等多种交互模式,优化多模态交互的实时性与准确性,提升用户体验 - 开发多模态信息融合算法,提升机器人的环境感知与意图理解能力 - 设计实现仿生交互系统,使机器人能以自然、拟人化方式与用户互动,与算法、设计团队合作,将先进的交互技术融入产品 - 建立多模态交互评测体系,持续改进交互质量 - 研究前沿人机交互技术,持续推动产品创新

更新于 2025-03-25